Veille IA chinoise — 18 juin 2026

TL;DR

GLM-5.2 open source MIT (17 juin) : Zhipu publie les poids complets (753B params MoE, 40B actifs) sur HuggingFace et ModelScope. Licence MIT sans restriction géographique — concrétisation de l’annonce du 13 juin.
Benchmarks détaillés disponibles : model card HuggingFace et blog officiel publient les scores complets. GLM-5.2 atteint 62,1 % sur SWE-bench Pro (open source SOTA), 81,0 sur Terminal Bench 2.1, et 99,2 sur AIME 2026. Écart avec Claude Opus 4.8 réduit à ~7 pts sur SWE-bench Pro.
IndexShare : nouvelle technique de réutilisation d’indexeur entre couches d’attention sparse, réduisant les FLOPs par token de 2,9× en contexte 1M.
Onde de choc Fable 5 (suite) : Fortune publie une analyse de l’impact structurel — la demande de modèles chinois sur OpenRouter dépasse désormais celle des modèles US (top 4 : DeepSeek, MiniMax, Tencent, Xiaomi).
DeepSeek V4.1 toujours attendu en juin, pas encore publié au 18 juin.

Actualités du jour

GLM-5.2 : poids MIT officiellement publiés sur HuggingFace

Acteur : Zhipu AI (智谱 / Z.ai) Apport clé : Publication des poids BF16/FP8 sous MIT sur zai-org/GLM-5.2. Architecture MoE 753B params, 40B actifs par token, contexte 1M, sortie 128K. Technique IndexShare (arxiv 2603.12201) pour réduire les FLOPs de 2,9× en contexte long. Amélioration du MTP layer pour décodage spéculatif (+20 % acceptance length). Type de source : dépôt officiel HuggingFace + blog Z.ai Benchmark vérifié : partiellement — scores publiés par le labo, mais reproductibles via les poids ouverts. Pas encore d’évaluation indépendante tierce (OpenCompass, LMArena) pour GLM-5.2 spécifiquement.

Mise à jour par rapport au rapport du 16 juin : le rapport précédent mentionnait l’annonce (13 juin) et la prévision de publication « semaine du 16 juin ». Les poids sont désormais effectivement disponibles depuis le 17 juin. Le blog officiel et la model card HuggingFace ont été publiés simultanément.

Benchmarks détaillés (model card HuggingFace) :

Benchmark	GLM-5.2	GLM-5.1	Qwen3.7-Max	MiniMax M3	DeepSeek-V4-Pro	Claude Opus 4.8	GPT-5.5
SWE-bench Pro	62,1	58,4	60,6	59,0	55,4	69,2	58,6
Terminal Bench 2.1	81,0	63,5	75,0	65,0	64,0	85,0	84,0
AIME 2026	99,2	95,3	97,0	—	94,6	95,7	98,3
HLE	40,5	31,0	41,4	37,0	37,7	49,8	41,4
MCP-Atlas	76,8	71,8	76,4	74,2	73,6	77,8	75,3

GLM-5.2 se positionne comme le meilleur modèle open source sur les tâches de codage longue durée. L’écart avec Claude Opus 4.8 sur SWE-bench Pro est de 7,1 pts (62,1 vs 69,2), mais GLM-5.2 dépasse GPT-5.5 (58,6) et DeepSeek-V4-Pro (55,4). Sur AIME 2026, GLM-5.2 (99,2) surpasse tous les concurrents listés, y compris GPT-5.5 (98,3) et Claude Opus 4.8 (95,7).

La technique IndexShare (préprint arXiv 2603.12201) réutilise le même indexeur sur 4 couches consécutives d’attention sparse, ce qui réduit les FLOPs par token de 2,9× en contexte 1M tout en maintenant la qualité. Cette innovation architecturale est une contribution notable pour l’inférence efficace en contexte très long.

Déploiement local supporté via vLLM (v0.23.0+), SGLang (v0.5.13.post1+), Transformers (v0.5.12+), KTransformers et plateformes Ascend NPU (vLLM-Ascend, xLLM, SGLang).

HuggingFace — zai-org/GLM-5.2 — HuggingFace, 17 juin 2026 Z.ai Blog — GLM-5.2: Built for Long-Horizon Tasks — Z.ai / HuggingFace Blog, 17 juin 2026 AIHub — GLM-5.2 上线并开源 — AIHub, 17 juin 2026 知乎 — GLM-5.2上线并开源 — 知乎, 17 juin 2026 虎嗅 — 智谱开源GLM-5.2 — 虎嗅, juin 2026

Onde de choc Fable 5 : l’open source chinois en bénéficiaire structurel

Acteur : Écosystème LLM chinois (ensemble) Apport clé : Analyse Fortune (16 juin) : la demande de modèles chinois sur OpenRouter dépasse celle des modèles US — les 4 modèles les plus utilisés la semaine précédente sont DeepSeek, MiniMax, Tencent et Xiaomi. L’embargo Fable 5 est analysé comme un accélérateur structurel de la substitution. Type de source : analyse presse (source non chinoise — Fortune) Benchmark vérifié : N/A

Mise à jour par rapport au rapport du 16 juin : le rapport précédent couvrait l’annonce de l’embargo (12 juin), la réaction de Zhipu et l’envolée boursière (+47 %). L’élément nouveau est la confirmation quantitative de la bascule de la demande vers les modèles chinois sur les plateformes intermédiaires (OpenRouter), ainsi que la publication des poids GLM-5.2 comme réponse concrète (voir actualité précédente).

Anthropic a depuis mis en place un système de vérification d’identité par photo pour rétablir partiellement l’accès à Fable 5, ce qui génère une nouvelle controverse sur la vie privée.

Fortune — Anthropic’s Fable fiasco leaves door open for open-source AI — Fortune, 16 juin 2026 (source non chinoise) 虎嗅 — Anthropic Fable 5 刷脸验证引争议 — 虎嗅, juin 2026

DeepSeek V4.1 : toujours attendu, pas encore publié

Acteur : DeepSeek (深度求索) Apport clé : V4.1 prévu pour juin 2026 avec couverture multimodale (image + audio en entrée) et support MCP natif renforcé. Pas de date précise annoncée. V4-Pro et V4-Flash restent en preview depuis le 24 avril. Type de source : reprises presse (OSCHINA, DataLearner) Benchmark vérifié : N/A (modèle non encore publié)

Aucun changement de statut depuis le rapport du 16 juin. Le modèle est toujours en développement. DeepSeek a finalisé un tour de financement record de 500 Mds de yuans (~73,5 Mds USD), le plus important jamais réalisé par une entreprise IA chinoise.

OSCHINA — DeepSeek V4.1 计划 — OSCHINA, mai 2026 DataLearner — DeepSeek V4.1 模型卡 — DataLearner, juin 2026

Tableau récapitulatif

Actu	Acteur	Apport clé	Date	Source
GLM-5.2 poids MIT publiés	Zhipu (智谱)	753B MoE, 40B actifs, contexte 1M, IndexShare	17 juin	HuggingFace
GLM-5.2 benchmarks détaillés	Zhipu (智谱)	SWE-bench Pro 62,1 %, AIME 2026 99,2 %	17 juin	Blog Z.ai
Bascule OpenRouter vers modèles CN	Écosystème	Top 4 modèles = CN (DeepSeek, MiniMax, Tencent, Xiaomi)	16 juin	Fortune
DeepSeek V4.1 en attente	DeepSeek (深度求索)	Multimodal + MCP, prévu juin, non publié	—	OSCHINA

Sources

HuggingFace — zai-org/GLM-5.2 — HuggingFace — 17 juin 2026
Z.ai Blog — GLM-5.2: Built for Long-Horizon Tasks — Z.ai / HuggingFace — 17 juin 2026
AIHub — GLM-5.2 上线并开源 — AIHub — 17 juin 2026
知乎 — GLM-5.2上线并开源 — 知乎 — 17 juin 2026
虎嗅 — 智谱开源GLM-5.2 — 虎嗅 — juin 2026
Fortune — Anthropic’s Fable fiasco leaves door open for open-source AI — Fortune — 16 juin 2026 (source non chinoise)
虎嗅 — Fable 5 刷脸验证引争议 — 虎嗅 — juin 2026
OSCHINA — DeepSeek V4.1 计划 — OSCHINA — mai 2026
DataLearner — DeepSeek V4.1 — DataLearner — juin 2026