Alibaba QwQ et ACE : Les nouveaux champions de l’intelligence artificielle
Dans le monde ultra-compétitif de l’intelligence artificielle (IA), dominé par les géants occidentaux tels qu’OpenAI et Google, la Chine se fait une place avec ses propres champions. Alibaba Cloud attire l’attention avec Alibaba QwQ, un modèle open source remarquable capable de raisonnement complexe, qui pourrait bien rebattre les cartes du secteur. Dans ce contexte, l’arrivée de QwQ et de ACE renforce la position chinoise dans la course à l’IA, avec des modèles tels que DeepSeek qui gagnent en puissance.
Qu’est-ce que le modèle QwQ ?
Proposé par Alibaba, le modèle QwQ ou « Qwen with Questions » est conçu pour simuler le raisonnement humain afin de résoudre des problèmes complexes. Doté de 32,5 milliards de paramètres organisés en couches attentionnelles multitêtes, il peut traiter des données massives et sophistiquées. Ce modèle se distingue par sa capacité à accomplir des tâches analytiques qui surpassent les capacités traditionnelles de nombreux autres modèles similaires. Lors d’un test sur la résolution de problèmes mathématiques de niveau olympiade, Alibaba QwQ a démontré une précision de 82,3 %, surpassant le modèle GPT-4 qui a obtenu un score de 76,1 %.
Un raisonnement pas-à-pas avec des sous-tâches séquentielles
QwQ utilise une architecture qui favorise une compréhension approfondie. Il est capable d’appliquer des techniques avancées de planification et d’exécution stratégique. Son mécanisme de raisonnement pas-à-pas, inspiré des travaux de Google DeepMind sur AlphaGeometry, lui permet de décomposer les problèmes en sous-tâches séquentielles. Par exemple, lorsqu’il est confronté à une question de combinatoire, le modèle QwQ génère d’abord une représentation symbolique du problème, puis il applique des heuristiques probabilistes pour explorer les solutions possibles avant de sélectionner la plus optimale.
Un champion toutes catégories de mathématiques
QwQ est conçu pour offrir des réponses pertinentes à des problèmes mathématiques et logiques. Il surpasse déjà certains grands noms de l’industrie comme les modèles o1 d’OpenAI lors de tests spécifiques. Sa capacité à effectuer un raisonnement détaillé et à fournir des analyses exhaustives à travers plusieurs étapes avant d’atteindre une conclusion est la clé de son succès. Par exemple, une étude interne menée par Alibaba sur un ensemble de données de 10 000 équations différentielles a révélé que QwQ réduisait les erreurs de prédiction de 27 % par rapport à Claude 3.
Alibaba QwQ se destine aux analyses complexes
Une analyse plus minutieuse révèle que QwQ excelle particulièrement dans les tâches qui nécessitent une inférence symbolique. Par exemple, pour les énigmes logiques du type « Sudoku contraint », QwQ a atteint un taux de résolution de 94 % en moins de 10 secondes, contre 88 % pour GPT-4 dans des conditions similaires. QwQ montre un potentiel d’application considérable, qui pourrait avoir un impact significatif dans divers domaines. Il est particulièrement doué pour les environnements qui nécessitent une profonde aptitude analytique, et est donc bien adapté à des tâches complexes comme la modélisation financière ou la recherche opérationnelle.
Une analyste particulièrement têtue
Cependant, la quête incessante pour l’excellence technique présente aussi des défis. Les longues chaînes de raisonnement peuvent parfois conduire à des boucles sans fin et peuvent ne pas aboutir à une réponse finale satisfaisante. Un test réalisé par des chercheurs indépendants a montré la
Share this content: