DeepSeek R2: Quand une startup chinoise bouscule les mastodontes américains de l’IA

DeepSeek R2: Quand une startup chinoise bouscule les mastodontes américains de l'IA

DeepSeek R2: Quand une startup chinoise bouscule les mastodontes américains de l’IA

Après avoir ébranlé Wall Street avec le lancement de son prédécesseur, la startup chinoise DeepSeek frappe plus fort avec R2, une intelligence artificielle (IA) open source, qui semble prête à rivaliser avec les grandes entités américaines de l’IA, notamment OpenAI et Nvidia.

Un lancement qui promet de faire des vagues

Le 8 mai 2025, un événement en ligne pourrait marquer le lancement officiel de R2. Ce nouveau modèle semble prêt à concurrencer directement les modèles d’OpenAI – o3, o4-mini – ainsi que le Gemini 2.0 Pro de Google. Sur le terrain chinois, cette IA s’apprête à affronter Qwen3 d’Alibaba.

Une prédiction audacieuse

Amjad Masad, le PDG de Replit, a prédit que le nouveau modèle R2 de DeepSeek aura des capacités similaires au dernier modèle o3 d’OpenAI. Si cette prédiction s’avère exacte, le paysage de l’intelligence artificielle pourrait connaître un bouleversement majeur.

Une architecture locale pour R2

Le successeur de R1, selon les informations divulguées, serait un modèle de raisonnement avancé. R2 promet des performances améliorées en codage, raisonnement multilingue et vision multimodale. Ce nouveau modèle contient 1 200 milliards de paramètres et est basé sur une architecture mixte d’experts. Une telle configuration garantit une haute efficacité, en activant seulement 78 milliards de paramètres par jeton.

Un virage technologique

Pour R2, DeepSeek décide de se passer des GPU de Nvidia au profit des puces Huawei Ascend 910B. Ce changement technologique permet de réduire la dépendance à l’égard des technologies étrangères et de diminuer les coûts d’entraînement de 97,3 % par rapport à GPT-4. De plus, l’entreprise a mis en place une chaîne d’approvisionnement locale dédiée au matériel IA, garantissant une plus grande autonomie et des délais de production réduits.

Il n’est donc pas étonnant que 5,2 pétaoctets de données suffisent pour entraîner R2, un modèle qui allie efficacité et rentabilité. Ce fait pourrait bien remettre en question la suprématie de Nvidia dans le domaine des puces IA.

Des performances avancées à un coût réduit

DeepSeek reste fidèle à sa philosophie open source et publie R2 sous licence MIT, accessible gratuitement. Le modèle peut être exécuté localement et sans connexion internet, éliminant ainsi les risques associés au cloud. De plus, son coût d’inférence est de seulement 0,07 dollar par million de tokens avec cache hit d’entrée. Il est donc possible que R2 provoque, comme son prédécesseur R1, des remous sur les marchés boursiers.

Cependant, des préoccupations persistent autour de la confidentialité. Pour rappel, R1 transmettait des données vers la Chine. Et R2, étant conçu par une entreprise chinoise, pourrait être soumis à l’accès gouvernemental. En réponse, DeepSeek recommande une installation 100 % locale, contournant ainsi habilement ces risques.

Des accusations qui pèsent sur sa réputation

Parallèlement, les accusations de distillation de données formulées par OpenAI continuent de peser sur la réputation de R2. Ces allégations, si elles sont confirmées, pourraient ternir l’image de ce nouveau modèle prometteur.

Conclusion

En somme, l’arrivée de R2 sur la scène de l’intelligence artificielle pourrait bien bouleverser le paysage technologique. Avec

Produits qui pourraient vous intéresser

DeepSeek R2: Quand une startup chinoise bouscule les mastodontes américains de l'IA
DeepSeek R2: Quand une startup chinoise bouscule les mastodontes américains de l'IA
DeepSeek R2: Quand une startup chinoise bouscule les mastodontes américains de l'IA

Share this content: