TL;DR
- Parité avec la frontière mondiale : DeepSeek V4, Qwen3.7-Max et Kimi K2.6 rivalisent tête-à-tête avec GPT-5.x, Claude Opus 4.x et Gemini 3.x sur les benchmarks indépendants (LMArena, BenchLM).
- Open source comme arme stratégique : 8 des 10 meilleurs modèles open-source mondiaux sont chinois ; MIT est la licence dominante. DeepSeek V4, Kimi K2.6, GLM-5.2 (imminent), MiniMax M3 — tous ouverts.
- MoE quasi-universel : architecture Mixture-of-Experts adoptée par tous les modèles de pointe, avec 3–7 % d’activation des paramètres totaux et 1M tokens de contexte natif normalisé.
- Agents comme différenciateur clé : Kimi K2.6 orchestre 300 sous-agents pendant 12 h ; GLM-5.x pousse l’« Agentic Engineering » ; tous les grands labos en font un axe de compétition majeur.
- Autonomie matérielle en cours : Huawei Ascend 950PR en production de masse (1,56 PFLOPS FP4, 2,8× le H20), adaptation Day-0 par les grands modèles. Nouvelles restrictions export US (31 mai 2026).
- Capital : phase de maturité : premières IPO LLM mondiales (Zhipu 智谱 et MiniMax à Hong Kong en janvier 2026), tours records (Moonshot AI : 2 Mds USD, StepFun : >50 Mds de yuans).
1. Modèles phares — état mi-2026
DeepSeek V4 (深度求索)
Acteur : DeepSeek (深度求索) Apport clé : Plus grand modèle open-source MoE au monde. V4-Pro : 1,6T paramètres / 49B actifs ; V4-Flash : 284B / 13B actifs. Contexte 1M natif via Hybrid Attention (73 % de réduction des FLOPs par token). Support Day-0 Huawei Ascend NPU. Type de source : annonce officielle + analyse technique Benchmark vérifié : auto-déclaré >80 % sur SWE-bench Verified ; classé 87/100 sur BenchLM Chinese (évaluation tierce) Licence : MIT Date : 24 avril 2026
DeepSeek V4 marque un tournant : il combine le plus grand modèle MoE ouvert avec une architecture Hybrid Attention qui réduit drastiquement le coût du contexte long. DeepSeek R2 (mars 2026) avait introduit le framework mHC (manifold-constrained hyperconnection) pour le raisonnement, avec jusqu’à 40 000 tokens de réflexion sur les problèmes mathématiques. DeepSeek-Prover-V2 (671B MoE, 37B actifs) atteint 88,9 % sur MiniF2F-test.
博客园 — DeepSeek V4 详解 — 博客园, avril 2026 观察者网 — 观察者网, 24 avril 2026
Qwen3.7-Max (通义千问 — Alibaba)
Acteur : Alibaba Cloud / 通义千问 Apport clé : MoE à l’échelle du trillion. Raisonnement unifié texte/image/code (« All-field Thinking »). SWE-bench Verified 72,3 %. N.1 domestique en Arena blind test (devant Kimi K2.6, DeepSeek V4-Pro, GLM-5.1). Inférence à 1/25 du coût de GPT-5.5 (déclaré). Type de source : annonce officielle (Alibaba Cloud Summit) Benchmark vérifié : N.1 Arena blind test (évaluation indépendante) ; SWE-bench auto-déclaré Date : 20 mai 2026
Versions antérieures 2026 : Qwen3.5 (février, 397B/17B actifs, 201 langues) et Qwen3.6-Plus (avril, 1,4T tokens d’appels API en 24 h — record de trafic).
新浪财经 — Qwen3.7-Max 发布 — 新浪财经, 20 mai 2026 证券时报 — 证券时报, mai 2026
Kimi K2.6 (月之暗面 — Moonshot AI)
Acteur : Moonshot AI (月之暗面) Apport clé : MoE 1T paramètres / 32B actifs, 384 experts, contexte 256K. Agent cluster : 300 sous-agents, 4 000 pas coordonnés, 12 h d’exécution continue. Multimodal natif. +20 % code vs K2.5. Type de source : annonce officielle Benchmark vérifié : N/A (comparaison Arena uniquement) Licence : Modified MIT, poids pré-entraînement ouverts, usage commercial gratuit Date : 21 avril 2026
Contribution recherche majeure : « Attention Residuals » (16 mars 2026) — refonte de la connexion résiduelle dans les Transformers, réduisant de 25 % le calcul d’entraînement. Optimiseur MuonClip : doublement de l’efficacité d’entraînement à budget calcul égal, adopté ensuite par DeepSeek V4.
AIHub — Kimi K2.6 — AIHub, avril 2026 IT之家 — IT之家, avril 2026
GLM-5.2 (智谱 / Z.ai)
Acteur : Zhipu AI (智谱) Apport clé : Troisième itération 2026 (GLM-5 → 5.1 → 5.2). GLM-5 : 744B / 40B actifs, 28,5T tokens d’entraînement, contexte 1M. Spécialisé « Agentic Engineering ». Sparse attention type DeepSeek. Type de source : annonce officielle Benchmark vérifié : GLM-5.1 classé 83/100 sur BenchLM Chinese (évaluation tierce) Licence : MIT (open-source prévu semaine du 16 juin pour GLM-5.2) Date : 13 juin 2026
Zhipu est devenue la première société « pure LLM » cotée en bourse (IPO Hong Kong, 8 janvier 2026).
IT之家 — GLM-5.2 — IT之家, 13 juin 2026 量子位 — GLM-5 — 量子位, février 2026
MiniMax M3
Acteur : MiniMax (MiniMax) Apport clé : Sparse attention MSA propriétaire, 1M contexte, multimodal natif (texte, image, vidéo, desktop). Output jusqu’à 128K tokens. Computer Use intégré. Prefilling 9,7× plus rapide que M2.7. Type de source : annonce officielle Benchmark vérifié : N/A Licence : open-source Date : 1er juin 2026
Premier modèle chinois combinant coding/agentic + MSA 1M + multimodal natif + Computer Use.
新浪财经 — MiniMax M3 — 新浪财经, 2 juin 2026
Hunyuan Hy3 Preview (混元 — Tencent)
Acteur : Tencent (腾讯) Apport clé : MoE 295B / 21B actifs (7 % d’activation), 256K contexte. Réduction délibérée de taille pour la « densité d’intelligence unitaire ». Développé en 3 mois. Function Calling + deep thinking entrelacés. Type de source : annonce officielle Benchmark vérifié : N/A Licence : open-source Date : 22 avril 2026
IT之家 — Hy3 — IT之家, avril 2026
Wenxin 5.1 (文心 — Baidu)
Acteur : Baidu (百度) Apport clé : Coût d’entraînement déclaré à ~6 % du coût des modèles de taille équivalente. Multimodal. LMArena search ranking : 1 223 pts, N.1 domestique, N.4 mondial (évaluation indépendante). Type de source : annonce officielle Benchmark vérifié : oui (LMArena — évaluation indépendante) Date : 9 mai 2026
ERNIE-Image (15 avril 2026) : modèle text-to-image 8B open-source, exécutable sur GPU consommateur 24 GB.
证券时报 — 证券时报, mai 2026
Doubao-Seed-2.0 (豆包 — ByteDance)
Acteur : ByteDance / 火山引擎 (Volcano Engine) Apport clé : Optimisé agents à grande échelle. Pro benchmarké contre GPT-5.2 à 1/10 du prix (déclaré). Variantes Pro, Lite, Mini, Code. Lite upgradé en mai 2026 : premier multimodal de la famille. Type de source : annonce officielle Benchmark vérifié : médaille d’or IMO, CMO, ICPC (auto-déclaré) Date : 14 février 2026
财新网 — 财新网, février 2026
Autres acteurs notables
Spark X2-Flash (星火 — iFlytek / 科大讯飞) — Avril 2026. MoE 30B, 256K contexte. Entraîné exclusivement sur Huawei Ascend 910B (2–3 millions de puces domestiques). 130+ langues. 电子发烧友 — 电子发烧友, avril 2026
MiMo-V2 (小米) — 19 mars 2026. Trois modèles : MiMo-V2-Pro (raisonnement agent, Claw-Eval 75,7, top-3 mondial auto-déclaré), MiMo-V2-Omni (multimodal, BigBench Audio 94,0), MiMo-V2-TTS (synthèse vocale, dialectes chinois). Lei Jun annonce 600 milliards de yuans d’investissement IA sur 3 ans. 中国日报 — 中国日报, mars 2026
Baichuan-M4 (百川智能) — Mai 2026. Spécialisé médecine. N.1 sur HealthBench (3 variantes, auto-déclaré). Taux d’hallucination factuelle réduit à 3,3 % via « fact-aware reinforcement learning ». chinaz — chinaz, mai 2026
Step 3.7 Flash (阶跃星辰 — StepFun) — 29 mai 2026. MoE 196B + 1,8B ViT, 11B actifs. 400 tokens/s en génération. Multimodal natif. Step 3.5 Flash (mars 2026) avait été le premier modèle chinois à ouvrir les poids base, mid-train et le framework d’entraînement (Steptron). IT之家 — IT之家, mai 2026
Yi / 01.AI (零一万物) — Pivot vers les solutions enterprise (WanZhi 2.5, janvier 2026). Pas de nouveau modèle de fondation identifié en 2026.
InternLM / 书生 (Shanghai AI Lab) — Dernière version connue : InternLM 2.5, contexte 1M, orientée raisonnement/maths/outils. Écosystème « général-spécialiste » (Wanxiang multimodal, Fengwu météo, Jishi finance). Open-source complet. Pas de mise à jour majeure 2026 S1 identifiée.
2. Recherche & publications récentes
| Contribution | Acteur | Date | Détail |
|---|---|---|---|
| Attention Residuals | Moonshot AI | 16 mars 2026 | Refonte des connexions résiduelles dans les Transformers. Réduction de 25 % du calcul d’entraînement |
| MuonClip optimizer | Moonshot AI | début 2026 | Variante de Muon, doublement de l’efficacité token-to-capability. Adopté par DeepSeek V4 |
| Hybrid Attention | DeepSeek | avril 2026 | 73 % de réduction des FLOPs par token à 1M contexte |
| mHC framework | DeepSeek | mars 2026 (R2) | Manifold-constrained hyperconnection, stabilité d’entraînement avec +6,7 % d’overhead calcul |
| MSA sparse attention | MiniMax | juin 2026 | Architecture attention parcimonieuse propriétaire, 9,7× prefilling, 15,6× décodage |
| Fact-aware RL | Baichuan | mai 2026 | Algorithme de RL réduisant les hallucinations factuelles à 3,3 % |
3. Open source
L’open source est devenu la stratégie par défaut des labos chinois en 2026. Selon une analyse 知乎, 8 des 10 meilleurs modèles open-source mondiaux sont chinois. La Chine est le 2e pays au monde en nombre de contributeurs open-source, avec la croissance la plus rapide (人民日报).
| Modèle | Licence | Date | Particularité |
|---|---|---|---|
| DeepSeek V4-Pro & V4-Flash | MIT | avril 2026 | Plus grand MoE ouvert |
| Kimi K2.6 | Modified MIT | avril 2026 | Poids pré-entraînement ouverts |
| GLM-5.2 | MIT | 13 juin 2026 | Open-source prévu semaine du 16 juin |
| Hy3 Preview (Tencent) | open-source | avril 2026 | MoE 295B compact |
| MiniMax M3 | open-source | juin 2026 | MSA + Computer Use |
| Step 3.5 Flash (StepFun) | open-source complet | mars 2026 | Poids base + mid-train + framework Steptron |
| ERNIE-Image (Baidu) | open-source | avril 2026 | Text-to-image 8B, GPU consommateur |
| Baichuan-M3 | open-source | janvier 2026 | Spécialisé médecine |
4. Benchmarks & classements
La plupart des scores sont auto-déclarés par les entreprises. Les évaluations tierces indépendantes sont explicitement signalées.
| Benchmark | Leader(s) | Score | Type |
|---|---|---|---|
| LMArena global | Wenxin 5.0 (Baidu) | 1 460 pts, N.8 mondial, N.1 CN | évaluation indépendante |
| LMArena chinois | 8 modèles CN dans le top 10 | GPT-4 Turbo ~99e place | évaluation indépendante |
| Arena blind test (mai 2026) | Qwen3.7-Max | devant K2.6, V4-Pro, GLM-5.1 | évaluation indépendante |
| BenchLM Chinese | DeepSeek V4-Pro : 87, GLM-5.1 : 83 | — | évaluation tierce |
| SWE-bench Verified | DeepSeek V4 >80 %, Qwen3.7-Max 72,3 % | — | auto-déclaré |
| Claw-Eval | MiMo-V2-Pro | 75,7, top-3 mondial | auto-déclaré |
| HealthBench | Baichuan-M4 | N.1 (3 variantes) | auto-déclaré |
OpenCompass (司南, Shanghai AI Lab) reste la référence domestique avec 3 modules (CompassKit, CompassHub, CompassRank). Les données détaillées du classement 2026 n’ont pas été trouvées dans les sources consultées.
5. Dynamique industrielle & business
IPO historiques (janvier 2026)
Zhipu (智谱) : IPO Hong Kong le 8 janvier 2026. Cours monté à 725 HKD le premier jour (introduction à 116,2 HKD). Première « action grand modèle de langage » au monde. 财联社 — 财联社, janvier 2026
MiniMax : IPO Hong Kong le 9 janvier 2026, code 00100. 14 investisseurs cornerstone (Alibaba, Abu Dhabi Investment Authority, IDG Capital) pour 2,723 Mds HKD. Explore une cotation secondaire au STAR Market de Shanghai (annonce 31 mai 2026). 1 million de clients développeurs mondiaux (mai 2026). 量子位 — 量子位, janvier 2026
Financements majeurs
| Startup | Tour | Montant | Valorisation | Source |
|---|---|---|---|---|
| 月之暗面 (Moonshot AI) | — | 2 Mds USD (en cours) | >20 Mds USD | 新浪财经, mai 2026 |
| 阶跃星辰 (StepFun) | B+ | >50 Mds de yuans | — | 36氪, 2026 |
| 小米 (Xiaomi) | investissement interne | 600 Mds de yuans sur 3 ans | — | 中国日报, mars 2026 |
Consolidation
Le paysage est passé des « 六小龙 » (Six Dragons) à une distinction plus claire : Zhipu et MiniMax sont cotés ; Moonshot AI et StepFun lèvent massivement ; 01.AI a pivoté vers l’enterprise. Le marché chinois des grands modèles est projeté à >700 Mds de yuans en 2026 (294 Mds en 2024). 界面新闻 — 界面新闻, 2026
6. Compute & matériel
Huawei Ascend 950PR (昇腾 950PR)
Production de masse : mars–avril 2026. Specs : 1,56 PFLOPS FP4, 112 GB mémoire HiBL (HBM auto-développée par Huawei), bande passante 1,4 TB/s. Performance 2,8× le FP4 du Nvidia H20. Prix : 70 000 yuans (~1/3 du H200). Livraisons prévues : >750 000 unités en 2026. Revenu AI chips Huawei projeté à ~12 Mds USD (+60 % YoY).
CANN Next : nouvelle architecture pour migration CUDA à faible coût. DeepSeek V4 a obtenu l’adaptation Day-0 sur 8 puces IA chinoises dont Ascend.
Roadmap : Ascend 950DT prévu fin 2026 avec mémoire HiZQ 2.0.
知乎 — Ascend 950PR — 知乎, 2026 电子工程专辑 — 电子工程专辑, 2026
Restrictions export US (31 mai 2026)
Le Department of Commerce US étend les restrictions aux filiales chinoises situées hors de Chine. Tout chip avancé (ECCN 3A090) — Nvidia Rubin, Blackwell, AMD MI350X — requiert une licence d’export si l’entité mère est enregistrée dans le Country Group D:5. Réponse chinoise : accélération de la substitution domestique.
新浪财经 — 新浪财经, juin 2026
7. Régulation & politique
| Texte | Date | Contenu clé |
|---|---|---|
| Bilan 备案 2025 | 9 janvier 2026 | 748 services GenAI enregistrés + 435 applications au 31 décembre 2025 |
| Règlement IA anthropomorphique (人工智能拟人化互动服务管理暂行办法) | 10 avril 2026, effectif 15 juillet 2026 | 5 ministères. Interdiction des services de relation intime virtuelle pour mineurs. Évaluation sécurité obligatoire si >1M utilisateurs ou >100K MAU. Watermarks IA obligatoires (visible + invisible) |
| Suspension de facto des 备案 financiers | début 2026 | Les régulateurs ont suspendu l’acceptation de nouvelles demandes d’enregistrement de grands modèles financiers |
CAC — 备案 bilan — cac.gov.cn, janvier 2026 CAC — règlement anthropomorphique — cac.gov.cn, avril 2026
8. Applications & agents
2026 est l’année de transition des agents IA du proof-of-concept au déploiement à grande échelle. Marché chinois des AI Agents : 57,4 Mds de yuans (2023), projeté à 330 Mds de yuans (2028), CAGR >100 %.
| Cas | Secteur | Impact |
|---|---|---|
| Meituan + MiniMax M2.5 | commerce | efficacité traitement contrats +80 %, analyse avis réduite de 1 jour à 1 h, économie 20M yuans/an |
| Midea : 5 000+ agents IA | manufacturing | réduction coûts de 40 % |
| Baidu : réforme KPI | corporate | obligation de 20 % d’amélioration d’efficacité via outils IA pour les employés clés (effectif 1er mai 2026) |
| Alibaba : lunettes IA Qwen | grand public | lancement mars 2026, commande resto + réservation hôtel |
| Baichuan 百小医 | santé | médecin généraliste IA, mai 2026 |
L’« Agentic Coding » est le différenciateur majeur : GLM-5.x, Kimi K2.6, DeepSeek V4, Qwen3.7 en font tous un axe de compétition principal. Zhipu positionne la transition du « VibeCoding » vers l’« Agentic Engineering ».
知乎 — AI Agents 2026 — 知乎, 2026
Tableau récapitulatif — modèles phares
| Modèle | Labo | Architecture | Params (total / actifs) | Contexte | Licence | Date |
|---|---|---|---|---|---|---|
| DeepSeek V4-Pro | DeepSeek (深度求索) | MoE | 1,6T / 49B | 1M | MIT | avril 2026 |
| Qwen3.7-Max | Alibaba (通义千问) | MoE | ~1T+ / — | — | — | mai 2026 |
| Kimi K2.6 | Moonshot AI (月之暗面) | MoE | 1T / 32B | 256K | Modified MIT | avril 2026 |
| GLM-5.2 | Zhipu (智谱) | MoE | ~744B / 40B | 1M | MIT | juin 2026 |
| MiniMax M3 | MiniMax | MSA | — | 1M | open-source | juin 2026 |
| Hy3 Preview | Tencent (混元) | MoE | 295B / 21B | 256K | open-source | avril 2026 |
| Wenxin 5.1 | Baidu (文心) | — | — | — | — | mai 2026 |
| Doubao-Seed-2.0 | ByteDance (豆包) | — | — | — | — | février 2026 |
| Step 3.7 Flash | StepFun (阶跃星辰) | MoE | 198B / 11B | — | — | mai 2026 |
| MiMo-V2 | Xiaomi (小米) | — | — | — | — | mars 2026 |
| Baichuan-M4 | Baichuan (百川智能) | — | — | — | — | mai 2026 |
| Spark X2-Flash | iFlytek (科大讯飞) | MoE | 30B / — | 256K | — | avril 2026 |
Sources
- 博客园 — DeepSeek V4 — 博客园 — avril 2026
- 观察者网 — DeepSeek V4 — 观察者网 — 24 avril 2026
- 知乎 — DeepSeek V4 Hybrid Attention — 知乎 — 2026
- 新浪财经 — Qwen3.7-Max — 新浪财经 — 20 mai 2026
- 证券时报 — Qwen — 证券时报 — mai 2026
- AIHub — Kimi K2.6 — AIHub — avril 2026
- IT之家 — Kimi K2.6 — IT之家 — avril 2026
- CSDN — Attention Residuals Moonshot — CSDN — mars 2026
- IT之家 — GLM-5.2 — IT之家 — 13 juin 2026
- 量子位 — GLM-5 — 量子位 — février 2026
- 新浪财经 — MiniMax M3 — 新浪财经 — 2 juin 2026
- IT之家 — Hy3 — IT之家 — avril 2026
- 证券时报 — Wenxin 5.1 — 证券时报 — mai 2026
- 财新网 — Doubao-Seed-2.0 — 财新网 — février 2026
- 电子发烧友 — Spark X2-Flash — 电子发烧友 — avril 2026
- 中国日报 — MiMo-V2 — 中国日报 — mars 2026
- chinaz — Baichuan-M4 — chinaz — mai 2026
- IT之家 — Step 3.7 Flash — IT之家 — mai 2026
- 财联社 — Zhipu IPO — 财联社 — janvier 2026
- 量子位 — MiniMax IPO — 量子位 — janvier 2026
- 36氪 — StepFun financement — 36氪 — 2026
- 新浪财经 — Moonshot AI tour — 新浪财经 — mai 2026
- 界面新闻 — consolidation — 界面新闻 — 2026
- 知乎 — Ascend 950PR — 知乎 — 2026
- 电子工程专辑 — Ascend — 电子工程专辑 — 2026
- 新浪财经 — export controls — 新浪财经 — juin 2026
- CAC — 备案 bilan — cac.gov.cn — janvier 2026
- CAC — règlement anthropomorphique — cac.gov.cn — avril 2026
- 知乎 — AI Agents 2026 — 知乎 — 2026
- 人民日报 — open-source Chine — 人民日报 — juin 2026