TL;DR

  • Parité avec la frontière mondiale : DeepSeek V4, Qwen3.7-Max et Kimi K2.6 rivalisent tête-à-tête avec GPT-5.x, Claude Opus 4.x et Gemini 3.x sur les benchmarks indépendants (LMArena, BenchLM).
  • Open source comme arme stratégique : 8 des 10 meilleurs modèles open-source mondiaux sont chinois ; MIT est la licence dominante. DeepSeek V4, Kimi K2.6, GLM-5.2 (imminent), MiniMax M3 — tous ouverts.
  • MoE quasi-universel : architecture Mixture-of-Experts adoptée par tous les modèles de pointe, avec 3–7 % d’activation des paramètres totaux et 1M tokens de contexte natif normalisé.
  • Agents comme différenciateur clé : Kimi K2.6 orchestre 300 sous-agents pendant 12 h ; GLM-5.x pousse l’« Agentic Engineering » ; tous les grands labos en font un axe de compétition majeur.
  • Autonomie matérielle en cours : Huawei Ascend 950PR en production de masse (1,56 PFLOPS FP4, 2,8× le H20), adaptation Day-0 par les grands modèles. Nouvelles restrictions export US (31 mai 2026).
  • Capital : phase de maturité : premières IPO LLM mondiales (Zhipu 智谱 et MiniMax à Hong Kong en janvier 2026), tours records (Moonshot AI : 2 Mds USD, StepFun : >50 Mds de yuans).

1. Modèles phares — état mi-2026

DeepSeek V4 (深度求索)

Acteur : DeepSeek (深度求索) Apport clé : Plus grand modèle open-source MoE au monde. V4-Pro : 1,6T paramètres / 49B actifs ; V4-Flash : 284B / 13B actifs. Contexte 1M natif via Hybrid Attention (73 % de réduction des FLOPs par token). Support Day-0 Huawei Ascend NPU. Type de source : annonce officielle + analyse technique Benchmark vérifié : auto-déclaré >80 % sur SWE-bench Verified ; classé 87/100 sur BenchLM Chinese (évaluation tierce) Licence : MIT Date : 24 avril 2026

DeepSeek V4 marque un tournant : il combine le plus grand modèle MoE ouvert avec une architecture Hybrid Attention qui réduit drastiquement le coût du contexte long. DeepSeek R2 (mars 2026) avait introduit le framework mHC (manifold-constrained hyperconnection) pour le raisonnement, avec jusqu’à 40 000 tokens de réflexion sur les problèmes mathématiques. DeepSeek-Prover-V2 (671B MoE, 37B actifs) atteint 88,9 % sur MiniF2F-test.

博客园 — DeepSeek V4 详解博客园, avril 2026 观察者网观察者网, 24 avril 2026


Qwen3.7-Max (通义千问 — Alibaba)

Acteur : Alibaba Cloud / 通义千问 Apport clé : MoE à l’échelle du trillion. Raisonnement unifié texte/image/code (« All-field Thinking »). SWE-bench Verified 72,3 %. N.1 domestique en Arena blind test (devant Kimi K2.6, DeepSeek V4-Pro, GLM-5.1). Inférence à 1/25 du coût de GPT-5.5 (déclaré). Type de source : annonce officielle (Alibaba Cloud Summit) Benchmark vérifié : N.1 Arena blind test (évaluation indépendante) ; SWE-bench auto-déclaré Date : 20 mai 2026

Versions antérieures 2026 : Qwen3.5 (février, 397B/17B actifs, 201 langues) et Qwen3.6-Plus (avril, 1,4T tokens d’appels API en 24 h — record de trafic).

新浪财经 — Qwen3.7-Max 发布新浪财经, 20 mai 2026 证券时报证券时报, mai 2026


Kimi K2.6 (月之暗面 — Moonshot AI)

Acteur : Moonshot AI (月之暗面) Apport clé : MoE 1T paramètres / 32B actifs, 384 experts, contexte 256K. Agent cluster : 300 sous-agents, 4 000 pas coordonnés, 12 h d’exécution continue. Multimodal natif. +20 % code vs K2.5. Type de source : annonce officielle Benchmark vérifié : N/A (comparaison Arena uniquement) Licence : Modified MIT, poids pré-entraînement ouverts, usage commercial gratuit Date : 21 avril 2026

Contribution recherche majeure : « Attention Residuals » (16 mars 2026) — refonte de la connexion résiduelle dans les Transformers, réduisant de 25 % le calcul d’entraînement. Optimiseur MuonClip : doublement de l’efficacité d’entraînement à budget calcul égal, adopté ensuite par DeepSeek V4.

AIHub — Kimi K2.6AIHub, avril 2026 IT之家IT之家, avril 2026


GLM-5.2 (智谱 / Z.ai)

Acteur : Zhipu AI (智谱) Apport clé : Troisième itération 2026 (GLM-5 → 5.1 → 5.2). GLM-5 : 744B / 40B actifs, 28,5T tokens d’entraînement, contexte 1M. Spécialisé « Agentic Engineering ». Sparse attention type DeepSeek. Type de source : annonce officielle Benchmark vérifié : GLM-5.1 classé 83/100 sur BenchLM Chinese (évaluation tierce) Licence : MIT (open-source prévu semaine du 16 juin pour GLM-5.2) Date : 13 juin 2026

Zhipu est devenue la première société « pure LLM » cotée en bourse (IPO Hong Kong, 8 janvier 2026).

IT之家 — GLM-5.2IT之家, 13 juin 2026 量子位 — GLM-5量子位, février 2026


MiniMax M3

Acteur : MiniMax (MiniMax) Apport clé : Sparse attention MSA propriétaire, 1M contexte, multimodal natif (texte, image, vidéo, desktop). Output jusqu’à 128K tokens. Computer Use intégré. Prefilling 9,7× plus rapide que M2.7. Type de source : annonce officielle Benchmark vérifié : N/A Licence : open-source Date : 1er juin 2026

Premier modèle chinois combinant coding/agentic + MSA 1M + multimodal natif + Computer Use.

新浪财经 — MiniMax M3新浪财经, 2 juin 2026


Hunyuan Hy3 Preview (混元 — Tencent)

Acteur : Tencent (腾讯) Apport clé : MoE 295B / 21B actifs (7 % d’activation), 256K contexte. Réduction délibérée de taille pour la « densité d’intelligence unitaire ». Développé en 3 mois. Function Calling + deep thinking entrelacés. Type de source : annonce officielle Benchmark vérifié : N/A Licence : open-source Date : 22 avril 2026

IT之家 — Hy3IT之家, avril 2026


Wenxin 5.1 (文心 — Baidu)

Acteur : Baidu (百度) Apport clé : Coût d’entraînement déclaré à ~6 % du coût des modèles de taille équivalente. Multimodal. LMArena search ranking : 1 223 pts, N.1 domestique, N.4 mondial (évaluation indépendante). Type de source : annonce officielle Benchmark vérifié : oui (LMArena — évaluation indépendante) Date : 9 mai 2026

ERNIE-Image (15 avril 2026) : modèle text-to-image 8B open-source, exécutable sur GPU consommateur 24 GB.

证券时报证券时报, mai 2026


Doubao-Seed-2.0 (豆包 — ByteDance)

Acteur : ByteDance / 火山引擎 (Volcano Engine) Apport clé : Optimisé agents à grande échelle. Pro benchmarké contre GPT-5.2 à 1/10 du prix (déclaré). Variantes Pro, Lite, Mini, Code. Lite upgradé en mai 2026 : premier multimodal de la famille. Type de source : annonce officielle Benchmark vérifié : médaille d’or IMO, CMO, ICPC (auto-déclaré) Date : 14 février 2026

财新网财新网, février 2026


Autres acteurs notables

Spark X2-Flash (星火 — iFlytek / 科大讯飞) — Avril 2026. MoE 30B, 256K contexte. Entraîné exclusivement sur Huawei Ascend 910B (2–3 millions de puces domestiques). 130+ langues. 电子发烧友电子发烧友, avril 2026

MiMo-V2 (小米) — 19 mars 2026. Trois modèles : MiMo-V2-Pro (raisonnement agent, Claw-Eval 75,7, top-3 mondial auto-déclaré), MiMo-V2-Omni (multimodal, BigBench Audio 94,0), MiMo-V2-TTS (synthèse vocale, dialectes chinois). Lei Jun annonce 600 milliards de yuans d’investissement IA sur 3 ans. 中国日报中国日报, mars 2026

Baichuan-M4 (百川智能) — Mai 2026. Spécialisé médecine. N.1 sur HealthBench (3 variantes, auto-déclaré). Taux d’hallucination factuelle réduit à 3,3 % via « fact-aware reinforcement learning ». chinazchinaz, mai 2026

Step 3.7 Flash (阶跃星辰 — StepFun) — 29 mai 2026. MoE 196B + 1,8B ViT, 11B actifs. 400 tokens/s en génération. Multimodal natif. Step 3.5 Flash (mars 2026) avait été le premier modèle chinois à ouvrir les poids base, mid-train et le framework d’entraînement (Steptron). IT之家IT之家, mai 2026

Yi / 01.AI (零一万物) — Pivot vers les solutions enterprise (WanZhi 2.5, janvier 2026). Pas de nouveau modèle de fondation identifié en 2026.

InternLM / 书生 (Shanghai AI Lab) — Dernière version connue : InternLM 2.5, contexte 1M, orientée raisonnement/maths/outils. Écosystème « général-spécialiste » (Wanxiang multimodal, Fengwu météo, Jishi finance). Open-source complet. Pas de mise à jour majeure 2026 S1 identifiée.


2. Recherche & publications récentes

ContributionActeurDateDétail
Attention ResidualsMoonshot AI16 mars 2026Refonte des connexions résiduelles dans les Transformers. Réduction de 25 % du calcul d’entraînement
MuonClip optimizerMoonshot AIdébut 2026Variante de Muon, doublement de l’efficacité token-to-capability. Adopté par DeepSeek V4
Hybrid AttentionDeepSeekavril 202673 % de réduction des FLOPs par token à 1M contexte
mHC frameworkDeepSeekmars 2026 (R2)Manifold-constrained hyperconnection, stabilité d’entraînement avec +6,7 % d’overhead calcul
MSA sparse attentionMiniMaxjuin 2026Architecture attention parcimonieuse propriétaire, 9,7× prefilling, 15,6× décodage
Fact-aware RLBaichuanmai 2026Algorithme de RL réduisant les hallucinations factuelles à 3,3 %

3. Open source

L’open source est devenu la stratégie par défaut des labos chinois en 2026. Selon une analyse 知乎, 8 des 10 meilleurs modèles open-source mondiaux sont chinois. La Chine est le 2e pays au monde en nombre de contributeurs open-source, avec la croissance la plus rapide (人民日报).

ModèleLicenceDateParticularité
DeepSeek V4-Pro & V4-FlashMITavril 2026Plus grand MoE ouvert
Kimi K2.6Modified MITavril 2026Poids pré-entraînement ouverts
GLM-5.2MIT13 juin 2026Open-source prévu semaine du 16 juin
Hy3 Preview (Tencent)open-sourceavril 2026MoE 295B compact
MiniMax M3open-sourcejuin 2026MSA + Computer Use
Step 3.5 Flash (StepFun)open-source completmars 2026Poids base + mid-train + framework Steptron
ERNIE-Image (Baidu)open-sourceavril 2026Text-to-image 8B, GPU consommateur
Baichuan-M3open-sourcejanvier 2026Spécialisé médecine

4. Benchmarks & classements

La plupart des scores sont auto-déclarés par les entreprises. Les évaluations tierces indépendantes sont explicitement signalées.

BenchmarkLeader(s)ScoreType
LMArena globalWenxin 5.0 (Baidu)1 460 pts, N.8 mondial, N.1 CNévaluation indépendante
LMArena chinois8 modèles CN dans le top 10GPT-4 Turbo ~99e placeévaluation indépendante
Arena blind test (mai 2026)Qwen3.7-Maxdevant K2.6, V4-Pro, GLM-5.1évaluation indépendante
BenchLM ChineseDeepSeek V4-Pro : 87, GLM-5.1 : 83évaluation tierce
SWE-bench VerifiedDeepSeek V4 >80 %, Qwen3.7-Max 72,3 %auto-déclaré
Claw-EvalMiMo-V2-Pro75,7, top-3 mondialauto-déclaré
HealthBenchBaichuan-M4N.1 (3 variantes)auto-déclaré

OpenCompass (司南, Shanghai AI Lab) reste la référence domestique avec 3 modules (CompassKit, CompassHub, CompassRank). Les données détaillées du classement 2026 n’ont pas été trouvées dans les sources consultées.


5. Dynamique industrielle & business

IPO historiques (janvier 2026)

Zhipu (智谱) : IPO Hong Kong le 8 janvier 2026. Cours monté à 725 HKD le premier jour (introduction à 116,2 HKD). Première « action grand modèle de langage » au monde. 财联社财联社, janvier 2026

MiniMax : IPO Hong Kong le 9 janvier 2026, code 00100. 14 investisseurs cornerstone (Alibaba, Abu Dhabi Investment Authority, IDG Capital) pour 2,723 Mds HKD. Explore une cotation secondaire au STAR Market de Shanghai (annonce 31 mai 2026). 1 million de clients développeurs mondiaux (mai 2026). 量子位量子位, janvier 2026

Financements majeurs

StartupTourMontantValorisationSource
月之暗面 (Moonshot AI)2 Mds USD (en cours)>20 Mds USD新浪财经, mai 2026
阶跃星辰 (StepFun)B+>50 Mds de yuans36氪, 2026
小米 (Xiaomi)investissement interne600 Mds de yuans sur 3 ans中国日报, mars 2026

Consolidation

Le paysage est passé des « 六小龙 » (Six Dragons) à une distinction plus claire : Zhipu et MiniMax sont cotés ; Moonshot AI et StepFun lèvent massivement ; 01.AI a pivoté vers l’enterprise. Le marché chinois des grands modèles est projeté à >700 Mds de yuans en 2026 (294 Mds en 2024). 界面新闻界面新闻, 2026


6. Compute & matériel

Huawei Ascend 950PR (昇腾 950PR)

Production de masse : mars–avril 2026. Specs : 1,56 PFLOPS FP4, 112 GB mémoire HiBL (HBM auto-développée par Huawei), bande passante 1,4 TB/s. Performance 2,8× le FP4 du Nvidia H20. Prix : 70 000 yuans (~1/3 du H200). Livraisons prévues : >750 000 unités en 2026. Revenu AI chips Huawei projeté à ~12 Mds USD (+60 % YoY).

CANN Next : nouvelle architecture pour migration CUDA à faible coût. DeepSeek V4 a obtenu l’adaptation Day-0 sur 8 puces IA chinoises dont Ascend.

Roadmap : Ascend 950DT prévu fin 2026 avec mémoire HiZQ 2.0.

知乎 — Ascend 950PR知乎, 2026 电子工程专辑电子工程专辑, 2026

Restrictions export US (31 mai 2026)

Le Department of Commerce US étend les restrictions aux filiales chinoises situées hors de Chine. Tout chip avancé (ECCN 3A090) — Nvidia Rubin, Blackwell, AMD MI350X — requiert une licence d’export si l’entité mère est enregistrée dans le Country Group D:5. Réponse chinoise : accélération de la substitution domestique.

新浪财经新浪财经, juin 2026


7. Régulation & politique

TexteDateContenu clé
Bilan 备案 20259 janvier 2026748 services GenAI enregistrés + 435 applications au 31 décembre 2025
Règlement IA anthropomorphique (人工智能拟人化互动服务管理暂行办法)10 avril 2026, effectif 15 juillet 20265 ministères. Interdiction des services de relation intime virtuelle pour mineurs. Évaluation sécurité obligatoire si >1M utilisateurs ou >100K MAU. Watermarks IA obligatoires (visible + invisible)
Suspension de facto des 备案 financiersdébut 2026Les régulateurs ont suspendu l’acceptation de nouvelles demandes d’enregistrement de grands modèles financiers

CAC — 备案 bilancac.gov.cn, janvier 2026 CAC — règlement anthropomorphiquecac.gov.cn, avril 2026


8. Applications & agents

2026 est l’année de transition des agents IA du proof-of-concept au déploiement à grande échelle. Marché chinois des AI Agents : 57,4 Mds de yuans (2023), projeté à 330 Mds de yuans (2028), CAGR >100 %.

CasSecteurImpact
Meituan + MiniMax M2.5commerceefficacité traitement contrats +80 %, analyse avis réduite de 1 jour à 1 h, économie 20M yuans/an
Midea : 5 000+ agents IAmanufacturingréduction coûts de 40 %
Baidu : réforme KPIcorporateobligation de 20 % d’amélioration d’efficacité via outils IA pour les employés clés (effectif 1er mai 2026)
Alibaba : lunettes IA Qwengrand publiclancement mars 2026, commande resto + réservation hôtel
Baichuan 百小医santémédecin généraliste IA, mai 2026

L’« Agentic Coding » est le différenciateur majeur : GLM-5.x, Kimi K2.6, DeepSeek V4, Qwen3.7 en font tous un axe de compétition principal. Zhipu positionne la transition du « VibeCoding » vers l’« Agentic Engineering ».

知乎 — AI Agents 2026知乎, 2026


Tableau récapitulatif — modèles phares

ModèleLaboArchitectureParams (total / actifs)ContexteLicenceDate
DeepSeek V4-ProDeepSeek (深度求索)MoE1,6T / 49B1MMITavril 2026
Qwen3.7-MaxAlibaba (通义千问)MoE~1T+ / —mai 2026
Kimi K2.6Moonshot AI (月之暗面)MoE1T / 32B256KModified MITavril 2026
GLM-5.2Zhipu (智谱)MoE~744B / 40B1MMITjuin 2026
MiniMax M3MiniMaxMSA1Mopen-sourcejuin 2026
Hy3 PreviewTencent (混元)MoE295B / 21B256Kopen-sourceavril 2026
Wenxin 5.1Baidu (文心)mai 2026
Doubao-Seed-2.0ByteDance (豆包)février 2026
Step 3.7 FlashStepFun (阶跃星辰)MoE198B / 11Bmai 2026
MiMo-V2Xiaomi (小米)mars 2026
Baichuan-M4Baichuan (百川智能)mai 2026
Spark X2-FlashiFlytek (科大讯飞)MoE30B / —256Kavril 2026

Sources