Multi-LLM in produzione: routing tra OpenAI, Anthropic, Gemini e Ollama
Quattro provider LLM dietro la stessa interfaccia, un router che sceglie per costo, latenza, capability e quota tenant, una cache semantica davanti, un fallback dietro. La forma reale del routing multi-LLM in produzione, raccontata dal codice.