Nouvelles de BlockBeats, le 4 avril, selon le dernier rapport du média technologique américain The Information : le nouveau modèle phare de nouvelle génération V4, que la startup chinoise d’IA DeepSeek s’apprête à publier, fonctionnera entièrement sur des puces développées en interne par Huawei. Il est considéré comme une étape importante pour la Chine dans sa démarche d’autonomisation de la filière des semi-conducteurs.
V4 devrait être publié dans les prochaines semaines et fonctionnera entièrement sur des puces Huawei. À cette fin, DeepSeek a collaboré pendant plusieurs mois avec Huawei et le concepteur de puces Cambricon, en réécrivant une partie du code au niveau inférieur du modèle afin de permettre sa compatibilité avec les puces domestiques.
À noter que cette fois, DeepSeek n’a pas accordé à Nvidia l’autorisation de tests anticipés de V4 : l’entreprise n’a invité que des acteurs de l’industrie chinoise des puces à participer à l’optimisation précoce, en rompant avec les pratiques habituelles du secteur.
Alibaba, ByteDance, Tencent et d’autres géants chinois de la tech ont déjà commandé par avance les dernières puces Ascend 950PR de Huawei, pour un volume de commandes total portant sur plusieurs dizaines de milliers de puces. Ils prévoient de déployer V4 via des services cloud et de l’intégrer à leurs propres applications d’IA. La demande en forte hausse fait grimper le prix de cette puce d’environ 20 %.
V4 utilise une architecture d’experts spécialisés (MoE). Le nombre total de paramètres est d’environ 1 000 milliards. À chaque inférence, environ 37 milliards de paramètres sont activés. Le modèle peut ainsi prendre en charge des entrées multimodales de texte, d’images et de code tout en conservant une faible latence.
L’an dernier, DeepSeek a publié des modèles à faible coût V3 et R1, ce qui avait entraîné une forte chute des actions technologiques à l’échelle mondiale, poussant le marché à remettre en question si les entreprises d’IA américaines avaient réellement besoin de dépenser plusieurs milliards de dollars pour acheter de la puissance de calcul. V4 est donc très suivi à l’international.