Novembre 2025 : Anthropic renverse la table avec Claude Opus 4.5

Article de Kami

350 milliards de dollars. C’est la valorisation colossale qu’Anthropic vient d’atteindre hier soir, propulsée par un investissement massif de Microsoft et Nvidia. Ce n’est pas un hasard : ce matin, ils ont lâché une bombe dans le monde de l’IA avec Claude Opus 4.5.

Après GPT 5.1 il y a trois semaines et Gemini 3 la semaine dernière, ce mois de novembre 2025 restera gravé dans l’histoire. Mais Opus 4.5 n’est pas juste « un modèle de plus ». C’est potentiellement celui qui va changer votre façon de travailler.

L’IA qui code mieux que les humains

Anthropic a fait passer à Opus 4.5 son propre test d’embauche pour ingénieurs en performance. Résultat ? Le modèle a obtenu un meilleur score que n’importe quel candidat humain jamais recruté par l’entreprise.

Les chiffres parlent d’eux-mêmes sur les benchmarks de référence :

SWE Bench Verified (Code) : 80,9 % (Le premier modèle à franchir la barre des 80 %, battant GPT 5.1 et Gemini 3).
Terminal Bench 2.0 : 59,3 % (Loin devant les 54 % de Gemini).
Tau Bench (Agents) : 98,2 % de réussite.

On ne parle plus de science-fiction, mais d’une IA capable de gérer un ordinateur et de coder de manière autonome avec une fiabilité inédite.

L’anecdote qui change tout : Le « Hack » de la compagnie aérienne

C’est sur le Tau Bench (simulation d’agent de service client) qu’Opus 4.5 a montré son génie.

Le scénario : Un client veut échanger un billet « Éco » contre un billet « Business ». Le règlement de la compagnie interdit la modification des billets Éco. La réponse attendue est un refus poli. Tous les autres modèles ont refusé. Pas Opus 4.5.

Sa solution ?

Il a surclassé le client (techniquement autorisé).
Il a effectué la modification sur ce nouveau billet.
Il a re-basculé le client en économie.

Le benchmark a compté cela comme une « erreur » car il attendait un refus, mais en réalité, l’IA a trouvé une faille créative (et techniquement légale) qu’aucun humain n’avait anticipée.

Moins cher, plus rapide, plus intelligent

La grande surprise, c’est le prix. Opus 4.5 coûte 5 $par million de tokens en entrée (contre 15$ pour la version précédente), soit une baisse de 67 %.

Mais l’économie réelle est ailleurs : le modèle est beaucoup plus concis. Pour une même tâche de code, là où l’ancien modèle utilisait 22 000 tokens, Opus 4.5 n’en utilise que 12 000. Moins de tokens facturés pour un meilleur résultat : le coût effectif s’effondre.

Côté technique, Anthropic introduit le « Tool Search Tool ». Au lieu de charger tous vos outils (GitHub, Slack, etc.) et de saturer la mémoire (contexte), l’IA ne « cherche » et ne charge l’outil que lorsqu’elle en a besoin. Résultat : 85 % d’économie de contexte.

Le verdict : L’ère de la spécialisation

Novembre 2025 nous apprend une chose : la course au « modèle unique qui fait tout » est terminée. Nous entrons dans l’ère des spécialistes.

Vous voulez du raisonnement pur ou de la multimodalité ? Gemini 3 de Google reste légèrement devant.
Vous voulez de la vision et de la conversation fluide ? GPT 5.1 est roi.
Vous voulez coder, créer des agents et travailler ? Claude Opus 4.5 est incontestablement le meilleur.

La vitesse de progression est vertigineuse. Ceux qui attendent que l’IA soit « mûre » pour s’y mettre sont déjà en retard. C’est mûr, et c’est maintenant.

Tuto comment utiliser son twitch prime et soutenir le site gratuitement.