TL;DR

  • GLM-5.2 open source MIT (17 juin) : Zhipu publie les poids complets (753B params MoE, 40B actifs) sur HuggingFace et ModelScope. Licence MIT sans restriction géographique — concrétisation de l’annonce du 13 juin.
  • Benchmarks détaillés disponibles : model card HuggingFace et blog officiel publient les scores complets. GLM-5.2 atteint 62,1 % sur SWE-bench Pro (open source SOTA), 81,0 sur Terminal Bench 2.1, et 99,2 sur AIME 2026. Écart avec Claude Opus 4.8 réduit à ~7 pts sur SWE-bench Pro.
  • IndexShare : nouvelle technique de réutilisation d’indexeur entre couches d’attention sparse, réduisant les FLOPs par token de 2,9× en contexte 1M.
  • Onde de choc Fable 5 (suite) : Fortune publie une analyse de l’impact structurel — la demande de modèles chinois sur OpenRouter dépasse désormais celle des modèles US (top 4 : DeepSeek, MiniMax, Tencent, Xiaomi).
  • DeepSeek V4.1 toujours attendu en juin, pas encore publié au 18 juin.

Actualités du jour

GLM-5.2 : poids MIT officiellement publiés sur HuggingFace

Acteur : Zhipu AI (智谱 / Z.ai) Apport clé : Publication des poids BF16/FP8 sous MIT sur zai-org/GLM-5.2. Architecture MoE 753B params, 40B actifs par token, contexte 1M, sortie 128K. Technique IndexShare (arxiv 2603.12201) pour réduire les FLOPs de 2,9× en contexte long. Amélioration du MTP layer pour décodage spéculatif (+20 % acceptance length). Type de source : dépôt officiel HuggingFace + blog Z.ai Benchmark vérifié : partiellement — scores publiés par le labo, mais reproductibles via les poids ouverts. Pas encore d’évaluation indépendante tierce (OpenCompass, LMArena) pour GLM-5.2 spécifiquement.

Mise à jour par rapport au rapport du 16 juin : le rapport précédent mentionnait l’annonce (13 juin) et la prévision de publication « semaine du 16 juin ». Les poids sont désormais effectivement disponibles depuis le 17 juin. Le blog officiel et la model card HuggingFace ont été publiés simultanément.

Benchmarks détaillés (model card HuggingFace) :

BenchmarkGLM-5.2GLM-5.1Qwen3.7-MaxMiniMax M3DeepSeek-V4-ProClaude Opus 4.8GPT-5.5
SWE-bench Pro62,158,460,659,055,469,258,6
Terminal Bench 2.181,063,575,065,064,085,084,0
AIME 202699,295,397,094,695,798,3
HLE40,531,041,437,037,749,841,4
MCP-Atlas76,871,876,474,273,677,875,3

GLM-5.2 se positionne comme le meilleur modèle open source sur les tâches de codage longue durée. L’écart avec Claude Opus 4.8 sur SWE-bench Pro est de 7,1 pts (62,1 vs 69,2), mais GLM-5.2 dépasse GPT-5.5 (58,6) et DeepSeek-V4-Pro (55,4). Sur AIME 2026, GLM-5.2 (99,2) surpasse tous les concurrents listés, y compris GPT-5.5 (98,3) et Claude Opus 4.8 (95,7).

La technique IndexShare (préprint arXiv 2603.12201) réutilise le même indexeur sur 4 couches consécutives d’attention sparse, ce qui réduit les FLOPs par token de 2,9× en contexte 1M tout en maintenant la qualité. Cette innovation architecturale est une contribution notable pour l’inférence efficace en contexte très long.

Déploiement local supporté via vLLM (v0.23.0+), SGLang (v0.5.13.post1+), Transformers (v0.5.12+), KTransformers et plateformes Ascend NPU (vLLM-Ascend, xLLM, SGLang).

HuggingFace — zai-org/GLM-5.2HuggingFace, 17 juin 2026 Z.ai Blog — GLM-5.2: Built for Long-Horizon TasksZ.ai / HuggingFace Blog, 17 juin 2026 AIHub — GLM-5.2 上线并开源AIHub, 17 juin 2026 知乎 — GLM-5.2上线并开源知乎, 17 juin 2026 虎嗅 — 智谱开源GLM-5.2虎嗅, juin 2026


Onde de choc Fable 5 : l’open source chinois en bénéficiaire structurel

Acteur : Écosystème LLM chinois (ensemble) Apport clé : Analyse Fortune (16 juin) : la demande de modèles chinois sur OpenRouter dépasse celle des modèles US — les 4 modèles les plus utilisés la semaine précédente sont DeepSeek, MiniMax, Tencent et Xiaomi. L’embargo Fable 5 est analysé comme un accélérateur structurel de la substitution. Type de source : analyse presse (source non chinoise — Fortune) Benchmark vérifié : N/A

Mise à jour par rapport au rapport du 16 juin : le rapport précédent couvrait l’annonce de l’embargo (12 juin), la réaction de Zhipu et l’envolée boursière (+47 %). L’élément nouveau est la confirmation quantitative de la bascule de la demande vers les modèles chinois sur les plateformes intermédiaires (OpenRouter), ainsi que la publication des poids GLM-5.2 comme réponse concrète (voir actualité précédente).

Anthropic a depuis mis en place un système de vérification d’identité par photo pour rétablir partiellement l’accès à Fable 5, ce qui génère une nouvelle controverse sur la vie privée.

Fortune — Anthropic’s Fable fiasco leaves door open for open-source AIFortune, 16 juin 2026 (source non chinoise) 虎嗅 — Anthropic Fable 5 刷脸验证引争议虎嗅, juin 2026


DeepSeek V4.1 : toujours attendu, pas encore publié

Acteur : DeepSeek (深度求索) Apport clé : V4.1 prévu pour juin 2026 avec couverture multimodale (image + audio en entrée) et support MCP natif renforcé. Pas de date précise annoncée. V4-Pro et V4-Flash restent en preview depuis le 24 avril. Type de source : reprises presse (OSCHINA, DataLearner) Benchmark vérifié : N/A (modèle non encore publié)

Aucun changement de statut depuis le rapport du 16 juin. Le modèle est toujours en développement. DeepSeek a finalisé un tour de financement record de 500 Mds de yuans (~73,5 Mds USD), le plus important jamais réalisé par une entreprise IA chinoise.

OSCHINA — DeepSeek V4.1 计划OSCHINA, mai 2026 DataLearner — DeepSeek V4.1 模型卡DataLearner, juin 2026


Tableau récapitulatif

ActuActeurApport cléDateSource
GLM-5.2 poids MIT publiésZhipu (智谱)753B MoE, 40B actifs, contexte 1M, IndexShare17 juinHuggingFace
GLM-5.2 benchmarks détaillésZhipu (智谱)SWE-bench Pro 62,1 %, AIME 2026 99,2 %17 juinBlog Z.ai
Bascule OpenRouter vers modèles CNÉcosystèmeTop 4 modèles = CN (DeepSeek, MiniMax, Tencent, Xiaomi)16 juinFortune
DeepSeek V4.1 en attenteDeepSeek (深度求索)Multimodal + MCP, prévu juin, non publiéOSCHINA

Sources