OpenAI publie ses premiers modèles d’IA ouverts depuis 2019

6 août 20256 août 2025

OpenAI publie enfin ses nouveaux modèles openweights, et ce alors que les convictions de Meta semblent vaciller. Ils incluent ses dernières techniques en matière de raisonnement, mais ne sont pas multimodaux et auront fort à faire pour s’imposer face aux modèles chinois.

OpenAI a publié deux modèles GPT-OSS le 5 août au soir. Il s’agit de ses premiers modèles ouverts depuis GPT-2, qui était sorti en 2019. L’entreprise avait promis qu’elle le ferait après avoir essuyé de nombreuses critiques ces dernières années sur son choix de fermer son écosystème, d’autant plus ironique étant donné son nom.

Les deux variantes sont gpt-oss-120b et gpt-oss-20b, qui comportent respectivement 117 et 21 milliards de paramètres. Ils sont disponibles sur Hugging Face et GitHub, sous licence Apache 2.0. OpenAI vante que gpt-oss-20b puisse tourner sur un simple PC haut de gamme, mais il est recommandé d’avoir une station de travail ou un système multi-GPU pour utiliser gpt-oss-120b.

Sur le papier, les performances sont au rendez-vous. OpenAI a publié des résultats de benchmark impressionnants, et indique que GPT-OSS intègre les techniques de raisonnement par “chaîne de pensée” (CoT) et d’utilisation d’outils (notamment Python) qu’elle a développé pour ses modèles commerciaux comme ceux de la famille o3. Dans les faits, les premiers retours utilisateurs semblent plus mitigés, avec notamment un nombre important d’hallucinations rapportées.

L’optimisation pour les benchmarks est une stratégie classique dans la tech, mais qui peut vite faire déchanter. Meta en a récemment fait les frais avec Llama-4, qui s’est avéré être un échec malgré un lancement en grande pompe . Les modèles GPT-OSS sont par ailleurs quantifiés en MXFP4 (pour en réduire la taille), ce qui limite la possibilité de créer des modèles dérivés et personnalisés pour les entreprises ou développeurs indépendants.

Pas de multimodalité

GPT-OSS risque donc d’avoir du mal à s’imposer face à la concurrence, notamment chinoise. Qwen 3 devrait rester la coqueluche du secteur pendant encore quelques temps. L’autre limitation de GPT-OSS est l’absence de multimodalité. Les deux modèles ne traitent que du texte, pas d’image ou de son, contrairement aux modèles Llama de Meta par exemple. Ils devraient malgré tout trouver leur utilité, et leur sortie ne peut qu’enrichir la communauté et se doit d’être saluée. D’autant plus alors que Mark Zuckerberg semble faire marche arrière sur sa stratégie open source depuis l’échec de Llama-4.

OpenAI a d’ailleurs indiqué que l’accueil de GPT-OSS conditionnerait la sortie ou pas d’autres modèles ouverts à l’avenir. Un bon entendeur. A noter au passage que même si ces modèles soient présentés comme ouverts, ils ne le sont qu’à moitié. Ils sont “openweight”, ce qui signifie que ni le code source, ni les données d’entraînement ne sont partagées. C’est devenu la pratique dans l’industrie, et les modèles Llama de Meta ou Gemma de Google suivent le même principe. Le français Mistral a publié quelques modèles complètement ouverts, comme Mistral NeMo, mais cela reste rare.

Articles similaires

Mali : une rançon et la libération de prisonniers sont toujours exigées par des groupes terroristes

DAKAR, 14 NOVEMBRE 2025(JVFE)–Le Mali traverse une situation critique : une rançon et la libération de prisonniers sont toujours exigées par des groupes terroristes. Les otages étrangers, l’autre pilier du “jihad économique” du JNIM contre Bamako Trois otages détenus par le Jnim (Groupe de soutien à l’islam et aux musulmans) au Mali ont été libérés après une rançon record, estimée entre 50 et 70 millions de dollars, ainsi que du matériel militaire. Pourquoi les Emirats ont-ils accepté cette rançon extrêmement élevée ? Depuis des années, les paiements de rançons nourrissent les groupes armés et affaiblissent l’État. Libérer des prisonniers revient…

Paris : un homme armé d’un couteau a attaqué des gendarmes près de l’Arc de Triomphe

DAKAR, 14 février 2026(JVFE)-Vendredi 13 février 2026, un homme armé d’un couteau a attaqué des gendarmes près de l’Arc de Triomphe à Paris, pendant la cérémonie du ravivage de la flamme du Soldat inconnu. Il n’a pas réussi à blesser gravement un gendarme, mais un autre militaire a ouvert le feu pour le neutraliser. L’assaillant a été transporté à l’hôpital, où il est décédé. Le Parquet national antiterroriste (PNAT) a ouvert une enquête pour déterminer ses motivations et d’éventuels liens terroristes. Le suspect était déjà connu des services de police et placé sous surveillance judiciaire. Aucun autre blessé n’a été…

l’essai nucléaire de Pokhran-II dans le contexte de la crise iranienne actuelle

DAKAR ,20 juillet 2025 (JVFE) : Les essais nucléaires Pokhran-II de l’Inde, également connus sous le nom de code “Opération Shakti”, ont eu lieu en mai 1998 à Pokhran, dans le désert du Rajasthan. Cette série d’essais a marqué la deuxième fois que l’Inde testait une arme nucléaire, après un premier essai en 1974. L’opération a consisté en cinq explosions : une bombe thermonucléaire (bombe H) et quatre bombes à fission. Ces essais ont fait de l’Inde une puissance nucléaire déclarée et ont suscité des réactions internationales, notamment des sanctions et des critiques. L’Inde a mené ces essais dans le contexte d’une course aux armements…

OpenAI publie ses premiers modèles d’IA ouverts depuis 2019

Laisser un commentaire Annuler la réponse

JVFE

Contacts

Receive our newsletters

Menu Utilisateurs

Nous suivre