TL;DR
- GLM-5.2 open source MIT (17 juin) : Zhipu publie les poids complets (753B params MoE, 40B actifs) sur HuggingFace et ModelScope. Licence MIT sans restriction géographique — concrétisation de l’annonce du 13 juin.
- Benchmarks détaillés disponibles : model card HuggingFace et blog officiel publient les scores complets. GLM-5.2 atteint 62,1 % sur SWE-bench Pro (open source SOTA), 81,0 sur Terminal Bench 2.1, et 99,2 sur AIME 2026. Écart avec Claude Opus 4.8 réduit à ~7 pts sur SWE-bench Pro.
- IndexShare : nouvelle technique de réutilisation d’indexeur entre couches d’attention sparse, réduisant les FLOPs par token de 2,9× en contexte 1M.
- Onde de choc Fable 5 (suite) : Fortune publie une analyse de l’impact structurel — la demande de modèles chinois sur OpenRouter dépasse désormais celle des modèles US (top 4 : DeepSeek, MiniMax, Tencent, Xiaomi).
- DeepSeek V4.1 toujours attendu en juin, pas encore publié au 18 juin.
Actualités du jour
GLM-5.2 : poids MIT officiellement publiés sur HuggingFace
Acteur : Zhipu AI (智谱 / Z.ai)
Apport clé : Publication des poids BF16/FP8 sous MIT sur zai-org/GLM-5.2. Architecture MoE 753B params, 40B actifs par token, contexte 1M, sortie 128K. Technique IndexShare (arxiv 2603.12201) pour réduire les FLOPs de 2,9× en contexte long. Amélioration du MTP layer pour décodage spéculatif (+20 % acceptance length).
Type de source : dépôt officiel HuggingFace + blog Z.ai
Benchmark vérifié : partiellement — scores publiés par le labo, mais reproductibles via les poids ouverts. Pas encore d’évaluation indépendante tierce (OpenCompass, LMArena) pour GLM-5.2 spécifiquement.
Mise à jour par rapport au rapport du 16 juin : le rapport précédent mentionnait l’annonce (13 juin) et la prévision de publication « semaine du 16 juin ». Les poids sont désormais effectivement disponibles depuis le 17 juin. Le blog officiel et la model card HuggingFace ont été publiés simultanément.
Benchmarks détaillés (model card HuggingFace) :
| Benchmark | GLM-5.2 | GLM-5.1 | Qwen3.7-Max | MiniMax M3 | DeepSeek-V4-Pro | Claude Opus 4.8 | GPT-5.5 |
|---|---|---|---|---|---|---|---|
| SWE-bench Pro | 62,1 | 58,4 | 60,6 | 59,0 | 55,4 | 69,2 | 58,6 |
| Terminal Bench 2.1 | 81,0 | 63,5 | 75,0 | 65,0 | 64,0 | 85,0 | 84,0 |
| AIME 2026 | 99,2 | 95,3 | 97,0 | — | 94,6 | 95,7 | 98,3 |
| HLE | 40,5 | 31,0 | 41,4 | 37,0 | 37,7 | 49,8 | 41,4 |
| MCP-Atlas | 76,8 | 71,8 | 76,4 | 74,2 | 73,6 | 77,8 | 75,3 |
GLM-5.2 se positionne comme le meilleur modèle open source sur les tâches de codage longue durée. L’écart avec Claude Opus 4.8 sur SWE-bench Pro est de 7,1 pts (62,1 vs 69,2), mais GLM-5.2 dépasse GPT-5.5 (58,6) et DeepSeek-V4-Pro (55,4). Sur AIME 2026, GLM-5.2 (99,2) surpasse tous les concurrents listés, y compris GPT-5.5 (98,3) et Claude Opus 4.8 (95,7).
La technique IndexShare (préprint arXiv 2603.12201) réutilise le même indexeur sur 4 couches consécutives d’attention sparse, ce qui réduit les FLOPs par token de 2,9× en contexte 1M tout en maintenant la qualité. Cette innovation architecturale est une contribution notable pour l’inférence efficace en contexte très long.
Déploiement local supporté via vLLM (v0.23.0+), SGLang (v0.5.13.post1+), Transformers (v0.5.12+), KTransformers et plateformes Ascend NPU (vLLM-Ascend, xLLM, SGLang).
HuggingFace — zai-org/GLM-5.2 — HuggingFace, 17 juin 2026 Z.ai Blog — GLM-5.2: Built for Long-Horizon Tasks — Z.ai / HuggingFace Blog, 17 juin 2026 AIHub — GLM-5.2 上线并开源 — AIHub, 17 juin 2026 知乎 — GLM-5.2上线并开源 — 知乎, 17 juin 2026 虎嗅 — 智谱开源GLM-5.2 — 虎嗅, juin 2026
Onde de choc Fable 5 : l’open source chinois en bénéficiaire structurel
Acteur : Écosystème LLM chinois (ensemble) Apport clé : Analyse Fortune (16 juin) : la demande de modèles chinois sur OpenRouter dépasse celle des modèles US — les 4 modèles les plus utilisés la semaine précédente sont DeepSeek, MiniMax, Tencent et Xiaomi. L’embargo Fable 5 est analysé comme un accélérateur structurel de la substitution. Type de source : analyse presse (source non chinoise — Fortune) Benchmark vérifié : N/A
Mise à jour par rapport au rapport du 16 juin : le rapport précédent couvrait l’annonce de l’embargo (12 juin), la réaction de Zhipu et l’envolée boursière (+47 %). L’élément nouveau est la confirmation quantitative de la bascule de la demande vers les modèles chinois sur les plateformes intermédiaires (OpenRouter), ainsi que la publication des poids GLM-5.2 comme réponse concrète (voir actualité précédente).
Anthropic a depuis mis en place un système de vérification d’identité par photo pour rétablir partiellement l’accès à Fable 5, ce qui génère une nouvelle controverse sur la vie privée.
Fortune — Anthropic’s Fable fiasco leaves door open for open-source AI — Fortune, 16 juin 2026 (source non chinoise) 虎嗅 — Anthropic Fable 5 刷脸验证引争议 — 虎嗅, juin 2026
DeepSeek V4.1 : toujours attendu, pas encore publié
Acteur : DeepSeek (深度求索) Apport clé : V4.1 prévu pour juin 2026 avec couverture multimodale (image + audio en entrée) et support MCP natif renforcé. Pas de date précise annoncée. V4-Pro et V4-Flash restent en preview depuis le 24 avril. Type de source : reprises presse (OSCHINA, DataLearner) Benchmark vérifié : N/A (modèle non encore publié)
Aucun changement de statut depuis le rapport du 16 juin. Le modèle est toujours en développement. DeepSeek a finalisé un tour de financement record de 500 Mds de yuans (~73,5 Mds USD), le plus important jamais réalisé par une entreprise IA chinoise.
OSCHINA — DeepSeek V4.1 计划 — OSCHINA, mai 2026 DataLearner — DeepSeek V4.1 模型卡 — DataLearner, juin 2026
Tableau récapitulatif
| Actu | Acteur | Apport clé | Date | Source |
|---|---|---|---|---|
| GLM-5.2 poids MIT publiés | Zhipu (智谱) | 753B MoE, 40B actifs, contexte 1M, IndexShare | 17 juin | HuggingFace |
| GLM-5.2 benchmarks détaillés | Zhipu (智谱) | SWE-bench Pro 62,1 %, AIME 2026 99,2 % | 17 juin | Blog Z.ai |
| Bascule OpenRouter vers modèles CN | Écosystème | Top 4 modèles = CN (DeepSeek, MiniMax, Tencent, Xiaomi) | 16 juin | Fortune |
| DeepSeek V4.1 en attente | DeepSeek (深度求索) | Multimodal + MCP, prévu juin, non publié | — | OSCHINA |
Sources
- HuggingFace — zai-org/GLM-5.2 — HuggingFace — 17 juin 2026
- Z.ai Blog — GLM-5.2: Built for Long-Horizon Tasks — Z.ai / HuggingFace — 17 juin 2026
- AIHub — GLM-5.2 上线并开源 — AIHub — 17 juin 2026
- 知乎 — GLM-5.2上线并开源 — 知乎 — 17 juin 2026
- 虎嗅 — 智谱开源GLM-5.2 — 虎嗅 — juin 2026
- Fortune — Anthropic’s Fable fiasco leaves door open for open-source AI — Fortune — 16 juin 2026 (source non chinoise)
- 虎嗅 — Fable 5 刷脸验证引争议 — 虎嗅 — juin 2026
- OSCHINA — DeepSeek V4.1 计划 — OSCHINA — mai 2026
- DataLearner — DeepSeek V4.1 — DataLearner — juin 2026