ChatGPT 5.4 : le modèle qui dépasse les humains et relance la polémique Pentagone

ChatGPT 5.4 : interface IA futuriste avec convergence de plusieurs modèles

Article de Kami

Le 28 février 2026 restera peut-être comme l’une des journées les plus mouvementées de l’histoire d’OpenAI. D’un côté, un record historique de désinstallations de ChatGPT, provoqué par l’annonce d’un partenariat avec le Pentagone. De l’autre, Claude d’Anthropic qui grimpe au sommet de l’App Store américain dans 6 pays simultanément. C’est dans ce contexte explosif qu’OpenAI a lancé ChatGPT 5.4, son modèle le plus ambitieux à ce jour. Après une semaine de tests intensifs, voici ce qu’il faut vraiment retenir de cette sortie.

Deux interfaces IA distinctes qui fusionnent en un modèle unifié

ChatGPT 5.4 : OpenAI met fin à la fragmentation de ses modèles

Jusqu’à présent, OpenAI souffrait d’un problème que ses concurrents n’avaient pas. Quand Anthropic sortait Claude Opus 4.6, c’était un modèle complet : raisonnement profond, écriture de code, personnalité agréable et capacités agentiques, le tout dans un seul package. Chez OpenAI, il fallait choisir entre GPT 5.2 pour la conversation et la créativité, ou GPT 5.3 Codex pour le code. Deux modèles séparés, deux expériences distinctes. Un peu comme un restaurant qui vous obligerait à manger l’entrée dans une salle et le plat principal dans une autre.

ChatGPT 5.4 met fin à cette fragmentation. OpenAI a fusionné le meilleur de Codex 5.2 et 5.3 en un modèle unifié. Et sur le papier, le résultat est impressionnant. Sur le benchmark GDPVal — qui évalue la capacité des modèles à accomplir de vraies tâches professionnelles sur 44 métiers différents — GPT 5.4 obtient 83 %, contre 78 % pour Claude Opus 4.6 et 70 % pour le précédent GPT 5.3. Un bond de 13 points en une seule génération, ce qui est remarquable.

Sur les usages bureautiques, le modèle brille également : il produit des feuilles Excel dignes d’un analyste junior en banque d’investissement (87,3 %), rédige des documents juridiques avec 91 % de précision et génère des présentations structurées de qualité professionnelle. Des tâches qui font partie du quotidien de millions de travailleurs du savoir.

Intelligence artificielle contrôlant un ordinateur de façon autonome

Computer use : quand l’IA dépasse les humains à 75 % sur OS World

C’est là que ChatGPT 5.4 marque une véritable rupture. Il est le premier modèle généraliste d’OpenAI capable de contrôler nativement un ordinateur : voir les captures d’écran, cliquer, taper au clavier, naviguer entre les applications. Sur le benchmark OS World, qui évalue spécifiquement cette capacité, GPT 5.4 atteint 75 %, dépassant pour la première fois les performances humaines, mesurées à 72,4 %.

Pour apprécier l’étendue du progrès, le précédent GPT 5.2 obtenait seulement 47,3 % sur ce même benchmark. On parle d’un gain de presque 28 points en une génération. Mais ce qui impressionne encore plus, c’est l’efficacité : GPT 5.2 avait besoin de 42 actions pour atteindre ses performances, GPT 5.4 n’en nécessite que 15 pour un résultat nettement supérieur. Moins d’actions, moins de tokens consommés, donc un coût d’usage réduit.

Autre innovation notable : le modèle dispose maintenant d’une fenêtre de contexte d’un million de tokens via l’API, soit l’équivalent de 7 romans complets. Vous pouvez lui soumettre un projet de code entier, un contrat de 500 pages ou l’intégralité d’un dossier juridique, et il maintiendra la cohérence du début à la fin. OpenAI comble ainsi son retard sur Google et Anthropic, qui offraient déjà cette capacité. Une autre nouveauté majeure : le modèle est désormais capable de trouver et d’utiliser automatiquement le bon outil depuis un vaste écosystème de connecteurs, réduisant la consommation de tokens de 47 % sur le benchmark MCP Atlas.

Trois systèmes IA en compétition sur un échiquier numérique

ChatGPT 5.4 face à Claude Opus 4.6 et Gemini 3.1 Pro : qui gagne vraiment ?

La vérité sur ChatGPT 5.4 ? Tout dépend de ce que vous en faites. Aucun modèle ne gagne sur tous les fronts simultanément, et cette version ne fait pas exception à la règle.

En programmation, la situation est nuancée. Sur le SWE Bench standard, Claude Opus 4.6 conserve l’avantage. Mais sur le SWE Bench Pro — la version la plus difficile, avec des projets privés résistants à la contamination des données d’entraînement — GPT 5.4 reprend l’avantage avec 57,7 % contre environ 46 % pour Opus. En raisonnement scientifique pur, Gemini 3.1 Pro de Google domine tout avec 94,3 % sur le GPQA Diamond, le benchmark de questions scientifiques de niveau doctoral.

Côté prix, GPT 5.4 est positionné à 2,50 $ par million de tokens en entrée (version standard) et 15 $ en sortie — soit moins cher que Claude Opus 4.6 à 5 $ l’entrée. La version pro monte à 30 $ l’entrée et 180 $ la sortie, des montants qu’OpenAI justifie par une efficacité accrue en tokens. Le modèle serait également 33 % moins susceptible de produire des informations fausses par rapport à GPT 5.2. Une bonne nouvelle pour ceux qui sont sensibles aux hallucinations des modèles de langage, même si le phénomène ne disparaît pas totalement.

Polémique autour du Pentagone et de l'IA : désinstallations massives de ChatGPT

La polémique Pentagone qui a fait exploser les désinstallations de ChatGPT

La sortie de ChatGPT 5.4 ne s’est pas faite dans un contexte serein. Le 27 février, le président Donald Trump a ordonné à toutes les agences fédérales américaines d’arrêter d’utiliser la technologie d’Anthropic. Quelques heures plus tard, OpenAI annonçait son accord avec le Département de la Défense américain.

La différence entre les deux entreprises ? Anthropic a refusé de lever ses garde-fous sur deux points précis : le risque d’utilisation pour la surveillance de masse des citoyens américains, et le déploiement dans des systèmes d’armes entièrement autonomes. Comme nous l’avions analysé dans notre article sur les deux lignes rouges d’Anthropic face au Pentagone, la société estimait que l’IA n’était pas prête pour ces usages. OpenAI, de son côté, a accepté le contrat tout en affirmant avoir les mêmes lignes rouges, protégées par une architecture différente : déploiement en cloud exclusif, stack de sécurité propriétaire et ingénieurs intégrés dans la chaîne de décision.

La réaction des utilisateurs a été immédiate et violente. Les avis une étoile sur l’App Store ont bondi de 775 % en une seule journée. Claude est devenu numéro 1 dans 6 pays. Plus de 875 employés de Google et OpenAI ont signé une lettre ouverte de soutien à la position d’Anthropic. Un mouvement baptisé « Quit GPT » a même organisé une manifestation devant le siège d’OpenAI. Sam Altman lui-même a admis que l’accord avait été fait « à la va-vite » — ce sont ses propres mots. C’est dans ce climat tendu qu’OpenAI avait besoin d’un coup technique pour changer la conversation.

Convergence des systèmes IA vers un modèle unique et unifié

La convergence des IA : vers un modèle unique capable de tout

Quand on prend du recul, la tendance la plus frappante n’est pas ChatGPT 5.4 lui-même, mais ce que sa sortie révèle sur toute l’industrie. Claude Opus 4.6 l’a fait en février. ChatGPT 5.4 le fait en mars. Gemini 3.1 Pro pousse dans la même direction. La fragmentation entre modèle de raisonnement, modèle de code et modèle généraliste est en train de disparaître.

Le rythme est vertigineux : Opus 4.5, Opus 4.6, Sonnet 4.6, ChatGPT 5.2, 5.3, Codex, maintenant 5.4, Gemini 3.1 Pro… Un modèle frontier presque chaque semaine. Ce rythme frénétique révèle que les laboratoires ont résolu leur cycle de pré-entraînement et coupent des versions dès que le niveau de performance est atteint. Il y a moins d’un an, OpenAI était en difficulté — GPT 4.5 était massif, lent et cher. Aujourd’hui, toute la famille GPT 5.x est rapide, efficace et compétitive. La reprise est spectaculaire.

Pour les professionnels francophones — freelances, créateurs de contenu, employés, entrepreneurs — ces modèles ne sont plus des curiosités technologiques. Ils sont devenus un véritable collègue numérique capable de produire un travail de qualité professionnelle en quelques minutes : rédiger un contrat, analyser un bilan financier, déboguer du code de production, créer une présentation client. Tout ça, désormais, avec un seul et même modèle. La question n’est plus de savoir si ces outils vont transformer votre façon de travailler. C’est déjà en train de se produire, et le rythme ne ralentit pas.