Veille IA chinoise — Panorama initial (14 juin 2026)

TL;DR

Parité avec la frontière mondiale : DeepSeek V4, Qwen3.7-Max et Kimi K2.6 rivalisent tête-à-tête avec GPT-5.x, Claude Opus 4.x et Gemini 3.x sur les benchmarks indépendants (LMArena, BenchLM).
Open source comme arme stratégique : 8 des 10 meilleurs modèles open-source mondiaux sont chinois ; MIT est la licence dominante. DeepSeek V4, Kimi K2.6, GLM-5.2 (imminent), MiniMax M3 — tous ouverts.
MoE quasi-universel : architecture Mixture-of-Experts adoptée par tous les modèles de pointe, avec 3–7 % d’activation des paramètres totaux et 1M tokens de contexte natif normalisé.
Agents comme différenciateur clé : Kimi K2.6 orchestre 300 sous-agents pendant 12 h ; GLM-5.x pousse l’« Agentic Engineering » ; tous les grands labos en font un axe de compétition majeur.
Autonomie matérielle en cours : Huawei Ascend 950PR en production de masse (1,56 PFLOPS FP4, 2,8× le H20), adaptation Day-0 par les grands modèles. Nouvelles restrictions export US (31 mai 2026).
Capital : phase de maturité : premières IPO LLM mondiales (Zhipu 智谱 et MiniMax à Hong Kong en janvier 2026), tours records (Moonshot AI : 2 Mds USD, StepFun : >50 Mds de yuans).

1. Modèles phares — état mi-2026

DeepSeek V4 (深度求索)

Acteur : DeepSeek (深度求索) Apport clé : Plus grand modèle open-source MoE au monde. V4-Pro : 1,6T paramètres / 49B actifs ; V4-Flash : 284B / 13B actifs. Contexte 1M natif via Hybrid Attention (73 % de réduction des FLOPs par token). Support Day-0 Huawei Ascend NPU. Type de source : annonce officielle + analyse technique Benchmark vérifié : auto-déclaré >80 % sur SWE-bench Verified ; classé 87/100 sur BenchLM Chinese (évaluation tierce) Licence : MIT Date : 24 avril 2026

DeepSeek V4 marque un tournant : il combine le plus grand modèle MoE ouvert avec une architecture Hybrid Attention qui réduit drastiquement le coût du contexte long. DeepSeek R2 (mars 2026) avait introduit le framework mHC (manifold-constrained hyperconnection) pour le raisonnement, avec jusqu’à 40 000 tokens de réflexion sur les problèmes mathématiques. DeepSeek-Prover-V2 (671B MoE, 37B actifs) atteint 88,9 % sur MiniF2F-test.

博客园 — DeepSeek V4 详解 — 博客园, avril 2026 观察者网 — 观察者网, 24 avril 2026

Qwen3.7-Max (通义千问 — Alibaba)

Acteur : Alibaba Cloud / 通义千问 Apport clé : MoE à l’échelle du trillion. Raisonnement unifié texte/image/code (« All-field Thinking »). SWE-bench Verified 72,3 %. N.1 domestique en Arena blind test (devant Kimi K2.6, DeepSeek V4-Pro, GLM-5.1). Inférence à 1/25 du coût de GPT-5.5 (déclaré). Type de source : annonce officielle (Alibaba Cloud Summit) Benchmark vérifié : N.1 Arena blind test (évaluation indépendante) ; SWE-bench auto-déclaré Date : 20 mai 2026

Versions antérieures 2026 : Qwen3.5 (février, 397B/17B actifs, 201 langues) et Qwen3.6-Plus (avril, 1,4T tokens d’appels API en 24 h — record de trafic).

新浪财经 — Qwen3.7-Max 发布 — 新浪财经, 20 mai 2026 证券时报 — 证券时报, mai 2026

Kimi K2.6 (月之暗面 — Moonshot AI)

Acteur : Moonshot AI (月之暗面) Apport clé : MoE 1T paramètres / 32B actifs, 384 experts, contexte 256K. Agent cluster : 300 sous-agents, 4 000 pas coordonnés, 12 h d’exécution continue. Multimodal natif. +20 % code vs K2.5. Type de source : annonce officielle Benchmark vérifié : N/A (comparaison Arena uniquement) Licence : Modified MIT, poids pré-entraînement ouverts, usage commercial gratuit Date : 21 avril 2026

Contribution recherche majeure : « Attention Residuals » (16 mars 2026) — refonte de la connexion résiduelle dans les Transformers, réduisant de 25 % le calcul d’entraînement. Optimiseur MuonClip : doublement de l’efficacité d’entraînement à budget calcul égal, adopté ensuite par DeepSeek V4.

AIHub — Kimi K2.6 — AIHub, avril 2026 IT之家 — IT之家, avril 2026

GLM-5.2 (智谱 / Z.ai)

Acteur : Zhipu AI (智谱) Apport clé : Troisième itération 2026 (GLM-5 → 5.1 → 5.2). GLM-5 : 744B / 40B actifs, 28,5T tokens d’entraînement, contexte 1M. Spécialisé « Agentic Engineering ». Sparse attention type DeepSeek. Type de source : annonce officielle Benchmark vérifié : GLM-5.1 classé 83/100 sur BenchLM Chinese (évaluation tierce) Licence : MIT (open-source prévu semaine du 16 juin pour GLM-5.2) Date : 13 juin 2026

Zhipu est devenue la première société « pure LLM » cotée en bourse (IPO Hong Kong, 8 janvier 2026).

IT之家 — GLM-5.2 — IT之家, 13 juin 2026 量子位 — GLM-5 — 量子位, février 2026

MiniMax M3

Acteur : MiniMax (MiniMax) Apport clé : Sparse attention MSA propriétaire, 1M contexte, multimodal natif (texte, image, vidéo, desktop). Output jusqu’à 128K tokens. Computer Use intégré. Prefilling 9,7× plus rapide que M2.7. Type de source : annonce officielle Benchmark vérifié : N/A Licence : open-source Date : 1er juin 2026

Premier modèle chinois combinant coding/agentic + MSA 1M + multimodal natif + Computer Use.

新浪财经 — MiniMax M3 — 新浪财经, 2 juin 2026

Hunyuan Hy3 Preview (混元 — Tencent)

Acteur : Tencent (腾讯) Apport clé : MoE 295B / 21B actifs (7 % d’activation), 256K contexte. Réduction délibérée de taille pour la « densité d’intelligence unitaire ». Développé en 3 mois. Function Calling + deep thinking entrelacés. Type de source : annonce officielle Benchmark vérifié : N/A Licence : open-source Date : 22 avril 2026

IT之家 — Hy3 — IT之家, avril 2026

Wenxin 5.1 (文心 — Baidu)

Acteur : Baidu (百度) Apport clé : Coût d’entraînement déclaré à ~6 % du coût des modèles de taille équivalente. Multimodal. LMArena search ranking : 1 223 pts, N.1 domestique, N.4 mondial (évaluation indépendante). Type de source : annonce officielle Benchmark vérifié : oui (LMArena — évaluation indépendante) Date : 9 mai 2026

ERNIE-Image (15 avril 2026) : modèle text-to-image 8B open-source, exécutable sur GPU consommateur 24 GB.

证券时报 — 证券时报, mai 2026

Doubao-Seed-2.0 (豆包 — ByteDance)

Acteur : ByteDance / 火山引擎 (Volcano Engine) Apport clé : Optimisé agents à grande échelle. Pro benchmarké contre GPT-5.2 à 1/10 du prix (déclaré). Variantes Pro, Lite, Mini, Code. Lite upgradé en mai 2026 : premier multimodal de la famille. Type de source : annonce officielle Benchmark vérifié : médaille d’or IMO, CMO, ICPC (auto-déclaré) Date : 14 février 2026

财新网 — 财新网, février 2026

Autres acteurs notables

Spark X2-Flash (星火 — iFlytek / 科大讯飞) — Avril 2026. MoE 30B, 256K contexte. Entraîné exclusivement sur Huawei Ascend 910B (2–3 millions de puces domestiques). 130+ langues. 电子发烧友 — 电子发烧友, avril 2026

MiMo-V2 (小米) — 19 mars 2026. Trois modèles : MiMo-V2-Pro (raisonnement agent, Claw-Eval 75,7, top-3 mondial auto-déclaré), MiMo-V2-Omni (multimodal, BigBench Audio 94,0), MiMo-V2-TTS (synthèse vocale, dialectes chinois). Lei Jun annonce 600 milliards de yuans d’investissement IA sur 3 ans. 中国日报 — 中国日报, mars 2026

Baichuan-M4 (百川智能) — Mai 2026. Spécialisé médecine. N.1 sur HealthBench (3 variantes, auto-déclaré). Taux d’hallucination factuelle réduit à 3,3 % via « fact-aware reinforcement learning ». chinaz — chinaz, mai 2026

Step 3.7 Flash (阶跃星辰 — StepFun) — 29 mai 2026. MoE 196B + 1,8B ViT, 11B actifs. 400 tokens/s en génération. Multimodal natif. Step 3.5 Flash (mars 2026) avait été le premier modèle chinois à ouvrir les poids base, mid-train et le framework d’entraînement (Steptron). IT之家 — IT之家, mai 2026

Yi / 01.AI (零一万物) — Pivot vers les solutions enterprise (WanZhi 2.5, janvier 2026). Pas de nouveau modèle de fondation identifié en 2026.

InternLM / 书生 (Shanghai AI Lab) — Dernière version connue : InternLM 2.5, contexte 1M, orientée raisonnement/maths/outils. Écosystème « général-spécialiste » (Wanxiang multimodal, Fengwu météo, Jishi finance). Open-source complet. Pas de mise à jour majeure 2026 S1 identifiée.

2. Recherche & publications récentes

Contribution	Acteur	Date	Détail
Attention Residuals	Moonshot AI	16 mars 2026	Refonte des connexions résiduelles dans les Transformers. Réduction de 25 % du calcul d’entraînement
MuonClip optimizer	Moonshot AI	début 2026	Variante de Muon, doublement de l’efficacité token-to-capability. Adopté par DeepSeek V4
Hybrid Attention	DeepSeek	avril 2026	73 % de réduction des FLOPs par token à 1M contexte
mHC framework	DeepSeek	mars 2026 (R2)	Manifold-constrained hyperconnection, stabilité d’entraînement avec +6,7 % d’overhead calcul
MSA sparse attention	MiniMax	juin 2026	Architecture attention parcimonieuse propriétaire, 9,7× prefilling, 15,6× décodage
Fact-aware RL	Baichuan	mai 2026	Algorithme de RL réduisant les hallucinations factuelles à 3,3 %

3. Open source

L’open source est devenu la stratégie par défaut des labos chinois en 2026. Selon une analyse 知乎, 8 des 10 meilleurs modèles open-source mondiaux sont chinois. La Chine est le 2e pays au monde en nombre de contributeurs open-source, avec la croissance la plus rapide (人民日报).

Modèle	Licence	Date	Particularité
DeepSeek V4-Pro & V4-Flash	MIT	avril 2026	Plus grand MoE ouvert
Kimi K2.6	Modified MIT	avril 2026	Poids pré-entraînement ouverts
GLM-5.2	MIT	13 juin 2026	Open-source prévu semaine du 16 juin
Hy3 Preview (Tencent)	open-source	avril 2026	MoE 295B compact
MiniMax M3	open-source	juin 2026	MSA + Computer Use
Step 3.5 Flash (StepFun)	open-source complet	mars 2026	Poids base + mid-train + framework Steptron
ERNIE-Image (Baidu)	open-source	avril 2026	Text-to-image 8B, GPU consommateur
Baichuan-M3	open-source	janvier 2026	Spécialisé médecine

4. Benchmarks & classements

La plupart des scores sont auto-déclarés par les entreprises. Les évaluations tierces indépendantes sont explicitement signalées.

Benchmark	Leader(s)	Score	Type
LMArena global	Wenxin 5.0 (Baidu)	1 460 pts, N.8 mondial, N.1 CN	évaluation indépendante
LMArena chinois	8 modèles CN dans le top 10	GPT-4 Turbo ~99e place	évaluation indépendante
Arena blind test (mai 2026)	Qwen3.7-Max	devant K2.6, V4-Pro, GLM-5.1	évaluation indépendante
BenchLM Chinese	DeepSeek V4-Pro : 87, GLM-5.1 : 83	—	évaluation tierce
SWE-bench Verified	DeepSeek V4 >80 %, Qwen3.7-Max 72,3 %	—	auto-déclaré
Claw-Eval	MiMo-V2-Pro	75,7, top-3 mondial	auto-déclaré
HealthBench	Baichuan-M4	N.1 (3 variantes)	auto-déclaré

OpenCompass (司南, Shanghai AI Lab) reste la référence domestique avec 3 modules (CompassKit, CompassHub, CompassRank). Les données détaillées du classement 2026 n’ont pas été trouvées dans les sources consultées.

5. Dynamique industrielle & business

IPO historiques (janvier 2026)

Zhipu (智谱) : IPO Hong Kong le 8 janvier 2026. Cours monté à 725 HKD le premier jour (introduction à 116,2 HKD). Première « action grand modèle de langage » au monde. 财联社 — 财联社, janvier 2026

MiniMax : IPO Hong Kong le 9 janvier 2026, code 00100. 14 investisseurs cornerstone (Alibaba, Abu Dhabi Investment Authority, IDG Capital) pour 2,723 Mds HKD. Explore une cotation secondaire au STAR Market de Shanghai (annonce 31 mai 2026). 1 million de clients développeurs mondiaux (mai 2026). 量子位 — 量子位, janvier 2026

Financements majeurs

Startup	Tour	Montant	Valorisation	Source
月之暗面 (Moonshot AI)	—	2 Mds USD (en cours)	>20 Mds USD	新浪财经, mai 2026
阶跃星辰 (StepFun)	B+	>50 Mds de yuans	—	36氪, 2026
小米 (Xiaomi)	investissement interne	600 Mds de yuans sur 3 ans	—	中国日报, mars 2026

Consolidation

Le paysage est passé des « 六小龙 » (Six Dragons) à une distinction plus claire : Zhipu et MiniMax sont cotés ; Moonshot AI et StepFun lèvent massivement ; 01.AI a pivoté vers l’enterprise. Le marché chinois des grands modèles est projeté à >700 Mds de yuans en 2026 (294 Mds en 2024). 界面新闻 — 界面新闻, 2026

6. Compute & matériel

Huawei Ascend 950PR (昇腾 950PR)

Production de masse : mars–avril 2026. Specs : 1,56 PFLOPS FP4, 112 GB mémoire HiBL (HBM auto-développée par Huawei), bande passante 1,4 TB/s. Performance 2,8× le FP4 du Nvidia H20. Prix : 70 000 yuans (~1/3 du H200). Livraisons prévues : >750 000 unités en 2026. Revenu AI chips Huawei projeté à ~12 Mds USD (+60 % YoY).

CANN Next : nouvelle architecture pour migration CUDA à faible coût. DeepSeek V4 a obtenu l’adaptation Day-0 sur 8 puces IA chinoises dont Ascend.

Roadmap : Ascend 950DT prévu fin 2026 avec mémoire HiZQ 2.0.

知乎 — Ascend 950PR — 知乎, 2026 电子工程专辑 — 电子工程专辑, 2026

Restrictions export US (31 mai 2026)

Le Department of Commerce US étend les restrictions aux filiales chinoises situées hors de Chine. Tout chip avancé (ECCN 3A090) — Nvidia Rubin, Blackwell, AMD MI350X — requiert une licence d’export si l’entité mère est enregistrée dans le Country Group D:5. Réponse chinoise : accélération de la substitution domestique.

新浪财经 — 新浪财经, juin 2026

7. Régulation & politique

Texte	Date	Contenu clé
Bilan 备案 2025	9 janvier 2026	748 services GenAI enregistrés + 435 applications au 31 décembre 2025
Règlement IA anthropomorphique (人工智能拟人化互动服务管理暂行办法)	10 avril 2026, effectif 15 juillet 2026	5 ministères. Interdiction des services de relation intime virtuelle pour mineurs. Évaluation sécurité obligatoire si >1M utilisateurs ou >100K MAU. Watermarks IA obligatoires (visible + invisible)
Suspension de facto des 备案 financiers	début 2026	Les régulateurs ont suspendu l’acceptation de nouvelles demandes d’enregistrement de grands modèles financiers

CAC — 备案 bilan — cac.gov.cn, janvier 2026 CAC — règlement anthropomorphique — cac.gov.cn, avril 2026

8. Applications & agents

2026 est l’année de transition des agents IA du proof-of-concept au déploiement à grande échelle. Marché chinois des AI Agents : 57,4 Mds de yuans (2023), projeté à 330 Mds de yuans (2028), CAGR >100 %.

Cas	Secteur	Impact
Meituan + MiniMax M2.5	commerce	efficacité traitement contrats +80 %, analyse avis réduite de 1 jour à 1 h, économie 20M yuans/an
Midea : 5 000+ agents IA	manufacturing	réduction coûts de 40 %
Baidu : réforme KPI	corporate	obligation de 20 % d’amélioration d’efficacité via outils IA pour les employés clés (effectif 1er mai 2026)
Alibaba : lunettes IA Qwen	grand public	lancement mars 2026, commande resto + réservation hôtel
Baichuan 百小医	santé	médecin généraliste IA, mai 2026

L’« Agentic Coding » est le différenciateur majeur : GLM-5.x, Kimi K2.6, DeepSeek V4, Qwen3.7 en font tous un axe de compétition principal. Zhipu positionne la transition du « VibeCoding » vers l’« Agentic Engineering ».

知乎 — AI Agents 2026 — 知乎, 2026

Tableau récapitulatif — modèles phares

Modèle	Labo	Architecture	Params (total / actifs)	Contexte	Licence	Date
DeepSeek V4-Pro	DeepSeek (深度求索)	MoE	1,6T / 49B	1M	MIT	avril 2026
Qwen3.7-Max	Alibaba (通义千问)	MoE	~1T+ / —	—	—	mai 2026
Kimi K2.6	Moonshot AI (月之暗面)	MoE	1T / 32B	256K	Modified MIT	avril 2026
GLM-5.2	Zhipu (智谱)	MoE	~744B / 40B	1M	MIT	juin 2026
MiniMax M3	MiniMax	MSA	—	1M	open-source	juin 2026
Hy3 Preview	Tencent (混元)	MoE	295B / 21B	256K	open-source	avril 2026
Wenxin 5.1	Baidu (文心)	—	—	—	—	mai 2026
Doubao-Seed-2.0	ByteDance (豆包)	—	—	—	—	février 2026
Step 3.7 Flash	StepFun (阶跃星辰)	MoE	198B / 11B	—	—	mai 2026
MiMo-V2	Xiaomi (小米)	—	—	—	—	mars 2026
Baichuan-M4	Baichuan (百川智能)	—	—	—	—	mai 2026
Spark X2-Flash	iFlytek (科大讯飞)	MoE	30B / —	256K	—	avril 2026

Sources

博客园 — DeepSeek V4 — 博客园 — avril 2026
观察者网 — DeepSeek V4 — 观察者网 — 24 avril 2026
知乎 — DeepSeek V4 Hybrid Attention — 知乎 — 2026
新浪财经 — Qwen3.7-Max — 新浪财经 — 20 mai 2026
证券时报 — Qwen — 证券时报 — mai 2026
AIHub — Kimi K2.6 — AIHub — avril 2026
IT之家 — Kimi K2.6 — IT之家 — avril 2026
CSDN — Attention Residuals Moonshot — CSDN — mars 2026
IT之家 — GLM-5.2 — IT之家 — 13 juin 2026
量子位 — GLM-5 — 量子位 — février 2026
新浪财经 — MiniMax M3 — 新浪财经 — 2 juin 2026
IT之家 — Hy3 — IT之家 — avril 2026
证券时报 — Wenxin 5.1 — 证券时报 — mai 2026
财新网 — Doubao-Seed-2.0 — 财新网 — février 2026
电子发烧友 — Spark X2-Flash — 电子发烧友 — avril 2026
中国日报 — MiMo-V2 — 中国日报 — mars 2026
chinaz — Baichuan-M4 — chinaz — mai 2026
IT之家 — Step 3.7 Flash — IT之家 — mai 2026
财联社 — Zhipu IPO — 财联社 — janvier 2026
量子位 — MiniMax IPO — 量子位 — janvier 2026
36氪 — StepFun financement — 36氪 — 2026
新浪财经 — Moonshot AI tour — 新浪财经 — mai 2026
界面新闻 — consolidation — 界面新闻 — 2026
知乎 — Ascend 950PR — 知乎 — 2026
电子工程专辑 — Ascend — 电子工程专辑 — 2026
新浪财经 — export controls — 新浪财经 — juin 2026
CAC — 备案 bilan — cac.gov.cn — janvier 2026
CAC — règlement anthropomorphique — cac.gov.cn — avril 2026
知乎 — AI Agents 2026 — 知乎 — 2026
人民日报 — open-source Chine — 人民日报 — juin 2026