Production

Decisioni tecniche, postmortem e numeri reali dal cluster che muove 45M visite/mese.

Multi-LLM in produzione: routing tra OpenAI, Anthropic, Gemini e Ollama

di Rocco Milluzzo
15 Ottobre 20248 Maggio 2026
Production

Quattro provider LLM dietro la stessa interfaccia, un router che sceglie per costo, latenza, capability e quota tenant, una cache semantica davanti, un fallback dietro. La forma reale del routing multi-LLM in produzione, raccontata dal codice.

Perché ho scelto Laravel su Node per AI Multisite (e perché lo rifarei)

di Rocco Milluzzo
17 Settembre 20248 Maggio 2026
Production

Settembre 2024. Laravel o Node per il backend di AI Multisite? Ho scritto e cancellato due prototipi prima di decidere. Quattro tradeoff tecnici concreti, una scelta che oggi rifarei.

Horizon vs supervisord: perché ho cambiato runner worker Laravel

di Rocco Milluzzo
21 Maggio 20248 Maggio 2026
Production

Maggio 2024. Dietro AI Multisite i worker Laravel su supervisord facevano il loro mestiere ma il debug era cieco. Ho migrato tutto a Horizon, ho rotto Redis con un payload da 14 MB, e ho capito cosa di supervisord tenermi ancora. Horizon vs supervisord worker Laravel, scelta misurata.

Indicizzare 50M articoli con Typesense: il piano, l’errore, il fix

di Rocco Milluzzo
9 Aprile 20248 Maggio 2026
Production

Aprile 2024. Dovevamo indicizzare 50 milioni di articoli sul cluster Typesense di AI Multisite. Il piano sembrava ragionevole. L’errore l’abbiamo visto in produzione: schema troppo grasso, RAM in saturazione.

Da MaxScale a una replica circolare james/jason: il giorno che il cluster ha smesso di tremare

di Rocco Milluzzo
13 Febbraio 20248 Maggio 2026
Production

Febbraio 2024. Due app server, due database editoriali grandi, MaxScale davanti, una replica circolare master-master tra james-db e jason-db. Il giorno che ho smesso di rispondere alle 5 del mattino agli alert e perché farei la stessa scelta architetturale oggi.

PHP 7.4 a 8.4 su 16 server in due settimane: il piano e tre incidenti

di Rocco Milluzzo
23 Gennaio 20248 Maggio 2026
Production

Gennaio 2024, sedici server HestiaCP da migrare da PHP 7.4 a 8.4 in due settimane, ~120 siti WordPress di clienti, zero ore di downtime contrattuale. Il piano rolling, il workflow, e tre incidenti reali in produzione: count(null) di un plugin, opcache mismatch, WP-CLI globale fuori sync. Postmortem onesto: PHP 7.4 a 8.4 fleet 16 server.

Hestia Control Panel come baseline cliente: SSL, mail e backup in un’ora

di Rocco Milluzzo
22 Agosto 20238 Maggio 2026
Production

Agosto 2023, primi mesi di Romiltec. Un template HestiaCP riproducibile che porta un cliente WordPress nuovo da server vuoto a produzione in un’ora: SSL automatico, mail con DKIM, backup off-site cifrati, tuning nginx. Logica, stack, e i due bug che ho dovuto correggere dopo il primo cliente reale: hestia control panel baseline cliente.

Hestia Control Panel su 8 server: la prima infra Romiltec, scelte e rimpianti

di Rocco Milluzzo
21 Agosto 20238 Maggio 2026
Production

Agosto 2023, primi mesi di Romiltec. Otto server bare-metal, HestiaCP su tutti, niente orchestrator. Le scelte che rifarei, quelle che ho pagato in operations e perché Hestia resta il punto di partenza giusto per una software house bootstrap.

Lo stack che mi sono portato dietro dopo otto anni da CTO

di Rocco Milluzzo
26 Giugno 20238 Maggio 2026
Production

Cosa ho copiato e cosa ho buttato dopo otto anni a guidare un’infrastruttura Laravel/MariaDB/MaxScale in una software house del territorio pisano. Lo stack iniziale di Romiltec, scelta per scelta.