Plusieurs entreprises se concentrent sur le développement de leurs propres projets d'intelligence artificielle, comme avec Anthropic. La société vient de lancer Claude Sonnet 4.5 et déclare qu'il s'agit du modèle de codage le meilleur et le plus sûr au monde.
La vérité est que l'entreprise a travaillé sur ce projet axé sur la programmation et, en plus de tout le potentiel qu'il propose, il a plusieurs développeurs et des capacités d'autonomie améliorées. De plus, le nouveau Claude Sonnet 4.5 a des agents logiciels complexes et dépasse ses prédécesseurs et ses rivaux, tels que Openai ou Google Gemini GPT-5.
Avantages de Claude Sonnet 4.5 pour les programmeurs
Ils veulent mettre en évidence des mises à jour importantes dans les outils de développeurs anthropiques, tels que la nouvelle extension de VS Code et un SDK d'agent. Tout cela dans le but de nous offrir des tâches autonomes plus sophistiquées et longues. Et pas seulement cela, puisque l'entreprise veut mettre en évidence le Sécurité améliorée du modèle. À tel point qu'il le jette sous protection ASL-3 afin d'atténuer les risques et de réduire les comportements nocifs.
Comme d'habitude, toutes ces déclarations qui communiquent à nous Anthropic sont soutenues par un ensemble de mesures qui positionnent Sonnet 4.5 au sommet de plusieurs classifications de l'industrie actuelle. Par exemple, l'annonce officielle met en évidence son travail dans des évaluations exigeantes telles que Swe-bench vérifié. Il s'agit d'un point de référence qui mesure la capacité d'une IA à résoudre de vrais problèmes d'ingénierie logicielle des référentiels GitHub.
Il convient également de noter que le modèle IA a établi un nouveau record dans OSWorld, la suite qui évalue sa capacité à effectuer des tâches informatiques pratiques dans le monde réel. Plus précisément, il a atteint un score de 61,4%, un LEAP significatif contre 42,2% obtenu par son prédécesseur, Sonnet 4. En même temps, cette performance est devant des concurrents tels que Gemini 2.5 Pro de Google ou Gpt-5 Dans plusieurs aspects.
Ces valeurs positionnent le nouveau modèle au-dessus des concurrents directs tels que Gemini 2.5 Pro avec 55,1% ou GPT-5 avec 58,3%, selon les métriques publiées par Anthropic dans son déclaration officielle.
Claude 4.5 Sonnet dépasse GPT-5 Codex et GPT-5 Gemini 2.5 Pro
À ce stade, un différenciateur clé est l'amélioration remarquable de la résistance du modèle pour les travaux autonomes. Anthropic rapporte que Sonnet 4.5 peut fonctionner dans des projets complexes de plusieurs étapes pendant plus de 30 heures en continu. Il s'agit d'une énorme avancée en ce qui concerne la capacité d'environ sept heures d'opus Claude 4.
De cette façon, le Nouveau IA Il démontre un niveau élevé d'autonomie pratique et à long terme qui va au-delà des tâches de codage isolées. Tout cela est soutenu par ses excellentes performances dans un large éventail d'évaluations qui mesurent le Compétences mathématiques et raisonnement.
Plus qu'une simple mise à jour du modèle, le lancement de Sonnet 4.5 est une croissance significative de l'écosystème pour les développeurs anthropes. Comme nous l'avons mentionné précédemment, la société a mis en œuvre un ensemble de nouveaux et Outils et fonctions puissantes Conçu pour que le développement de Claude soit plus fiable et autonome. Il est destiné à résoudre directement les principaux problèmes des développeurs dans la vie réelle. À son tour, l'expérience du développeur en ce sens s'améliore encore plus avec un Extension de code native vsactuellement en version bêta et peut descendre de là. Ce complément que nous vous disons intègre directement les capacités de Claude Code dans l'IDE.

Ainsi, il offre une interface graphique plus complète avec une barre latérale dédiée à l'IA. Tous destinés aux développeurs qui préfèrent travailler dans leur environnement graphique habituel. Divers tests montrent que la combinaison de ces outils améliore les performances de l'agent dans des tâches complexes dans 39%. En parallèle réduit la consommation de jetons de 84%.
| Modèle | OSWORLD (Tâches d'environnement réelles) | Autonomie (opération continue) | Fontaine |
|---|---|---|---|
| Claude Sonnet 4.5 | 61,4% | Plus de 30 heures | Anthropique |
| Gemini 2.5 Pro | 55,1% | ~ 22 heures (estimé) | Données du secteur |
| Claude Sonnet 4 (opus) | 42,2% | ~ 7 heures | Anthropique |
Enfin, nous vous dirons que peut-être la chose la plus importante pour les utilisateurs avancés est qu'Anthropic lance le SDK de l'agent de Claude. Ainsi, il donne aux développeurs accès à la même infrastructure centrale promue par Claude Code et permet la création d'agents personnalisés pour des flux de travail spécialisés. Quant à la sécurité intégrée, le modèle est lancé sous le niveau strict de niveau 3 ou ASL-3 de la société. Cela répond aux préoccupations de l'ensemble de l'industrie et cherche à générer de la confiance entre les clients d'entreprise.
Nous devons savoir que pour les développeurs, le prix reste inchangé par rapport à Claude Sonnet 4, c'est-à-dire, 3 dollars par million de jetons d'entrée et 15 dollars par million de jetons de départ.