Google dévoile Ironwood : Un bouleversement dans le monde des puces IA

Google dévoile Ironwood : Un bouleversement dans le monde des puces IA

Google dévoile Ironwood : Un bouleversement dans le monde des puces IA

Durant son événement phare Cloud Next à Las Vegas, Google a surpris l’assistance avec une série d’innovations qui soulignent ses ambitions grandissantes dans le domaine de l’intelligence artificielle. Cette semaine, on a vu l’annonce d’une nouvelle génération de puces IA, des modèles améliorés et une plateforme d’agents IA qui pourrait bien redistribuer les cartes dans le secteur. L’innovation qui a le plus marqué, c’est la présentation d’Ironwood, une nouvelle génération de Tensor Processing Unit (TPU). Microsoft et Amazon sont prévenus : la compétition s’intensifie.

Le point sur Ironwood

Après avoir fait sensation l’année précédente avec ses puces Trillium et une série de modèles de langage, Google n’a pas l’intention de s’arrêter en si bon chemin. Ironwood, la star de l’annonce, est une puce dédiée à l’IA qui rompt avec l’approche traditionnelle « entraînement + inférence ». Elle se consacre entièrement à la seconde étape, c’est-à-dire l’exécution de modèles d’IA une fois qu’ils ont été formés.

Ironwood se présente en deux configurations : une version de 256 puces et une autre, plus avancée, composée de 9 216 puces refroidies par liquide. Ces dernières sont interconnectées par un réseau ICI (Inter-Chip Interconnect) de dernière génération, qui se distingue par sa faible latence et sa bande passante élevée.

Performances d’Ironwood

Dans sa configuration maximale (9 216 puces par pod), Ironwood offre plus de 42 exaflops de puissance de calcul par pod. Cela représente 24 fois plus de puissance que le supercalculateur El Capitan, considéré comme une référence mondiale avec ses 1,7 exaflops par pod. Chaque puce Ironwood peut atteindre un pic de 4 614 TFLOPs, l’ensemble pouvant atteindre une puissance de près de 10 MW.

Quoi de neuf avec Ironwood?

Google affirme avoir doublé l’efficacité énergétique par rapport à la génération précédente, Trillium. Ironwood délivre ainsi deux fois plus de puissance par watt, atteignant 29,3 TFlops/Watt contre 14,6 TFlops/Watt pour Trillium. Par ailleurs, sa mémoire HBM (High Bandwidth Memory) a été considérablement améliorée, passant à 192 Go par puce, soit six fois plus que Trillium, avec une bande passante mémoire de 7,2 Tbps/puce, soit 4,5 fois celle de Trillium.

Ces améliorations permettent de traiter des modèles et des ensembles de données beaucoup plus grands tout en réduisant les transferts de données fréquents, ce qui améliore les performances globales. De plus, la bande passante ICI (Inter-Chip Interconnect) a été augmentée à 1,2 Tbps bidirectionnels, soit 1,5 fois celle de Trillium, garantissant une communication encore plus rapide entre les puces.

La menace pour Microsoft et Amazon

Google prévoit d’intégrer ses derniers TPU, y compris Ironwood, dans son supercalculateur AI Hypercomputer. Selon Mark Lohmeyer, vice-président de la division Compute & AI Infrastructure, l’objectif est de fournir le plus haut niveau d’intelligence par dollar pour les charges de travail d’IA.

Ce supercalculateur est conçu pour coordonner efficacement le matériel et le logiciel afin d’optimiser les performances sur les charges de travail IA les plus exigeantes. Il a déjà permis des avancées notables, notamment avec Gemini Flash 2.0, qui offre 24 fois plus d’intelligence par dollar que GPT-4 et 5 fois plus que DeepSeek-R1.

Applications et perspectives

Produits qui pourraient vous intéresser

Google dévoile Ironwood : Un bouleversement dans le monde des puces IA
Google dévoile Ironwood : Un bouleversement dans le monde des puces IA
Google dévoile Ironwood : Un bouleversement dans le monde des puces IA

Share this content: