Claude Opus 4.7 : le leak qui change tout chez Anthropic

Article de Kami

Depuis quelques semaines, une rumeur insistante traverse la communauté des utilisateurs de Claude. Opus 4.6, le modèle phare d’Anthropic, semblerait moins tranchant qu’avant. Réponses légèrement moins précises, raisonnement moins constant, limites de requêtes atteintes beaucoup plus vite. Rien d’officiel, mais le ressenti est très largement partagé. Et voilà qu’en parallèle, un certain Claude Opus 4.7 vient d’être repéré dans les références internes de l’API. Coincidence, ou stratégie assumée ?

Cette semaine a aussi révélé un projet plus discret mais tout aussi marquant : Anthropic travaillerait sur un studio de développement full-stack, directement intégré à Claude. De quoi se poser en face des Lovable et Replit actuels. Tour d’horizon d’une semaine chargée, entre accusations de nerf silencieux, polémique sur les tokens et préparations d’un futur écosystème développeur.

Opus 4.6 accusé d’avoir perdu en puissance

Le point de départ, c’est un ressenti largement partagé. Depuis plusieurs semaines, les utilisateurs d’Opus 4.6 remontent les mêmes observations. Les réponses paraissent moins affutées qu’avant. Le raisonnement tient moins bien sur la durée. La qualité globale semble avoir glissé d’un cran. Sur les plans haut de gamme comme le Max, les limites de requêtes se déclenchent beaucoup plus vite qu’au lancement du modèle.

Une hypothèse circule de plus en plus ouvertement sur X. Anthropic aurait volontairement distillé Opus 4.6, autrement dit abaissé sa qualité, pour préparer le terrain d’une prochaine génération. L’idée, c’est que si le modèle actuel semble un peu moins brillant, celui qui arrive derrière paraîtra d’autant plus impressionnant au lancement. Une mécanique marketing bien connue dans l’industrie.

Hypothèse d'une réduction volontaire des performances de Claude 4.6

Rien n’est confirmé officiellement par Anthropic. Il n’existe aucune communication qui prouverait une baisse volontaire. Mais le ressenti est suffisamment dense pour alimenter tous les threads techniques. Entre ceux qui parlent d’un vrai nerf et ceux qui évoquent plutôt un rééquilibrage de l’infrastructure, la ligne est mince. Dans tous les cas, la confiance s’est légèrement fissurée, et c’est là que le débat devient intéressant. Sur ce sujet, un récent épisode d’Anthropic avec deux fuites majeures en cinq jours avait déjà mis l’entreprise sous tension.

Ce qu’il faut retenir, c’est que l’utilisateur paye un abonnement pour un niveau de performance qu’il ne retrouve plus toujours. Quand Claude Code coûte cher et que les quotas s’épuisent en quelques heures au lieu de tenir la journée, la frustration monte vite. Le doute sur la stabilité du modèle devient alors un problème commercial, pas seulement technique.

Un benchmark qui vient confirmer la chute

Jusqu’ici, tout reposait sur du ressenti. Mais un benchmark vient de changer la donne. La plateforme BridgeBench a retesté Opus 4.6 cette semaine, et le résultat tranche avec la mesure précédente. La semaine dernière, le modèle était classé deuxième sur leur benchmark d’hallucination, avec une précision de 83,3 pour cent. Un très bon score, en ligne avec la réputation du modèle.

Benchmark BridgeBench montrant la chute de performance d'Opus 4.6

Après le retest, Opus 4.6 s’écrase à la dixième place du classement. La précision tombe à 68,3 pour cent. Quinze points de précision perdus en une semaine, sur un modèle présenté comme stable. Le chiffre est brutal. Il colle aux remontées des utilisateurs et donne un poids concret à la théorie du nerf silencieux. Même si la méthodologie d’un benchmark unique ne vaut pas preuve absolue, la coincidence est trop marquée pour être ignorée.

Le débat rejoint une question plus large sur la fiabilité des IA, comme l’ont exploré des chercheurs qui ont identifié les neurones H à l’origine des hallucinations. Quand un score d’hallucination fait un plongeon aussi rapide, la question n’est plus technique, elle devient éditoriale. Les utilisateurs veulent comprendre ce qui se passe.

Claude Opus 4.7 déjà repéré dans le code interne

Références internes à Claude Opus 4.7 dans l'API

C’est la trouvaille qui explique peut-être tout le reste. Claude Opus 4.7 a été repéré dans les références internes de l’API Anthropic. Ce type de détection se produit généralement peu de temps avant une sortie publique. Le schéma est connu chez tous les grands laboratoires. Les identifiants du prochain modèle apparaissent dans les logs, puis dans la documentation technique, avant que l’annonce soit officielle.

Si ce leak se confirme, il relie directement les deux pièces du puzzle. Un basculement de ressources d’Opus 4.6 vers Opus 4.7 expliquerait les baisses de performance observées sur l’ancien modèle. Ce n’est pas for&ceacute;ment un nerf délibéré, c’est peut-être un arbitrage d’infrastructure. Les GPU qui servaient à garantir la stabilité du 4.6 sont peut-être en train d’être réorientés vers l’entraînement ou la mise en production du 4.7.

Cette lecture est probablement la plus réaliste. Anthropic optimise en permanence ses coûts et son infrastructure. Préparer le lancement d’un nouveau modèle phare impose des compromis. Le modèle précédent en fait souvent les frais, surtout quand les quotas sont partagés. L’épisode de la fuite Claude Mythos il y a quelques semaines avait déjà montré à quel point la feuille de route d’Anthropic fuite par tous les bords.

Le token tax qui fait exploser les limites sur Claude Code

Un autre dossier sensible s’est ouvert cette semaine. Plusieurs développeurs parlent désormais d’un token tax appliqué par Anthropic sur Claude Code. L’histoire part d’un proxy HTTP qui a capturé les requêtes envoyées par les versions récentes de l’outil. Le constat est sans ambiguïté. Les nouvelles versions injectent un volume important de tokens supplémentaires côté serveur, alors même que l’entrée utilisateur reste quasiment identique.

Les chiffres avancés parlent d’environ 20 000 tokens supplémentaires par requête. Sur un usage intensif, l’addition grimpe très vite. C’est exactement ce qui expliquerait pourquoi les utilisateurs atteignent leurs limites bien plus rapidement qu’avant, y compris sur les plans les plus chers. L’intention derrière ces tokens n’est pas encore claire. Il peut s’agir d’un prompt système plus massif, de métadonnées de sécurité, ou d’un système de contexte élargi.

Inflation silencieuse des tokens sur Claude Code

Rien n’est encore validé officiellement par Anthropic. Mais la trace réseau est suffisamment solide pour que la discussion ne retombe pas. Dans les threads techniques, plusieurs ingénieurs partagent leurs propres captures et arrivent au même ordre de grandeur. Cette transparence forcée est probablement l’un des effets les plus intéressants du phénomène. Plus les outils IA s’installent dans les workflows, plus leur comportement réseau est surveillé.

Pour les utilisateurs concernés, une parade existe déjà. Il est possible de rétrograder Claude Code vers une version antérieure, avant l’apparition de ce comportement. La commande tient sur une ligne et fait revenir le client à une version plus sobre en tokens.

La commande npx claude-code@2.1.98 permet de basculer sur la version 2.1.98, considérée comme saine par une partie de la communauté. C’est une solution temporaire, pas durable, mais elle soulage le porte-monnaie en attendant un geste officiel d’Anthropic. Cette situation rappelle l’importance de tester soi-même les limites réelles de Claude Code plutôt que de se fier aux annonces.

Un studio full-stack signe Anthropic en préparation

Nouveau studio full-stack Anthropic pour Claude

En parallèle de ces polémiques, Anthropic prépare un chantier nettement plus ambitieux. L’entreprise travaillerait sur une plateforme de type AI Studio, dans la lignée du Google AI Studio. La promesse est claire : offrir un environnement complet de vibe coding full-stack directement connecté à Claude. Construire une application, la tester, la déployer, le tout sans quitter l’écosystème Anthropic.

Si cette piste se confirme, Anthropic passe officiellement du statut de fournisseur de modèles à celui de plateforme de développement. La concurrence directe se ferait alors face à Lovable et Replit, deux acteurs qui dominent aujourd’hui ce segment du développement assisté par IA. La différence, c’est qu’Anthropic arriverait avec son modèle maison en natif, sans couche d’abstraction tierce. Un atout technique décisif si l’expérience est bien pensée.

Cette stratégie rejoint une autre annonce discrète. Claude Code desktop reçoit une mise à jour qui unifie enfin l’interface et permet de travailler sur plusieurs dépôts au sein d’une seule instance. Ce genre de détail n’est pas anodin pour les développeurs qui jonglent avec plusieurs projets en parallèle. Couplé à la lignée Managed Agents, l’ensemble commence à ressembler à une véritable station de travail IA, comme le montrait déjà l’annonce des Claude Managed Agents en beta.

Claude for Word entre en beta sur Microsoft Word

Dernière annonce significative de la semaine, Anthropic a commencé le déploiement de Claude for Word en beta. L’intégration fonctionne directement depuis la barre latérale de Microsoft Word. Rédiger, éditer et réviser un document sans jamais sortir de l’application, le tout piloté par Claude. Les modifications apparaissent sous forme de changements suivis, exactement comme celles d’un collègue humain.

Ce détail est plus important qu’il n’y paraît. Jusqu’ici, travailler avec Claude sur un document long impliquait des allers-retours de copier-coller, avec la perte de mise en forme qui va avec. L’intégration native dans Word supprime cette friction. Le formatage est préservé, l’historique des modifications reste lisible, et le document garde son identité. Pour l’instant, la fonctionnalité est réservée aux plans Team et Enterprise. Mais le signal est clair. Anthropic veut embarquer Claude dans les outils de productivité où les utilisateurs passent déjà leur journée, plutôt que de leur imposer une interface supplémentaire.