Febbraio 11, 2026 — Zhipu AI (Z.ai) ha rilasciato ufficialmente GLM-5, il suo nuovo modello frontier da 744 miliardi di parametri che rivaleggia direttamente con Claude Opus 4.5 di Anthropic.
NB: articolo di test generato con AI
Specifiche Tecniche
- Parametri: 744 miliardi totali, 40 miliardi attivi per token (Mixture of Experts)
- Architettura: 256 esperti, 8 attivati per token
- Context window: 200.000 token
- Output capacity: 131.000 token
- Dati di training: 28.5 trilioni di token (rispetto a 23T di GLM-4.5)
- Attenzione: DeepSeek Sparse Attention (DSA) per efficiente gestione del contesto lungo
Benchmark: Prestazioni Record
GLM-5 si posiziona come #1 tra i modelli open-source su più classifiche:
- SWE-bench Verified: 77.8% (sfida Claude Opus 4.5 all’80.9%)
- Humanity’s Last Exam: 50.4% (batte Claude Opus 4.5 a 43.4% e GPT-5.2 a 45.8%)
- BrowseComp: 75.9% (#1 open-source)
- GPQA-Diamond: 86.0%
- AIME 2026: 92.7%
- AA-Omniscience Index: Score di -1 (miglioramento di 35 punti nel riconoscere quando non sapere)
Il modello ha anche ottenuto un record low hallucination rate con la nuova tecnica RL chiamata “slime”, riducendo significativamente le allucinazioni rispetto ai predecessori.
Indipendenza Hardware
GLM-5 rappresenta un punto di svolta geopolitico e tecnologico: è stato allenato interamente su chip Huawei Ascend usando il framework MindSpore, con zero dipendenza da hardware NVIDIA.
Questo è particolarmente significativo perché Zhipu AI è sulla U.S. Entity List dal gennaio 2025, con restrizioni all’accesso di GPU H100/H200. Il fatto che abbiano prodotto un modello frontier-level sotto questi vincoli dimostra la maturità dell’ecosistema semiconduttori cinese.
Prezzi e Disponibilità
GLM-5 è disponibile da febbraio 11, 2026:
- API ufficiale: $1.00 per milione di input tokens, $3.20 per milione di output tokens
- Confronto: ~5x più economico su input, ~8x più economico su output rispetto a Claude Opus 4.6 ($5/$25)
- OpenRouter: Disponibile a $0.80-$1.00 per milione di input tokens
- Piattaforma Z.ai: chat.z.ai (accesso gratuito)
- HuggingFace: Pesi disponibili sotto licenza MIT
Il “Pony Alpha” Mystery
Prima dell’annuncio ufficiale, GLM-5 è apparso su OpenRouter sotto l’alias “Pony Alpha” all’inizio di febbraio 2026, elaborando 40 miliardi di token nel primo giorno. Questo test silenzioso ha permesso di valutare le prestazioni senza bias da brand prima del lancio ufficiale.
Limiti Notevoli
- Text-only: Nessun supporto nativo multimodale (rispetto a Kimi K2.5)
- Situational awareness: Secondo early adopters, l’abilità di “vibe” e consapevolezza situazionale l’agguar dietro Claude
- Deploy locale: Richiede almeno 8 H200/H20 per inferenza FP8, rendendolo praticamente un modello API per la maggior parte degli utenti
Implicazioni per il Mercato AI
Zhipu AI è ora la prima azienda quotata in borsa (IPO Hong Kong, 8 gennaio 2026, $558 milioni raccolti) a produrre modelli frontier, distinguendosi da OpenAI e Anthropic che restano private.
Il gap tra AI cinese e occidentale, stimato a 12-18 mesi sei mesi fa, è ora ridotto a settimane o giorni. GLM-5 segnala che la Cina ha un competitore legittimo di Claude Opus, con architettura efficiente e già supportata dai tool mainstream.
Fonti: WinBuzzer, Medium – Maxime Labonne, VentureBeat, Reuters
Categorie: AI, Tecnologia, GLM-5, Z.ai
Lascia un commento