Anthropic prépare Opus 4.7 et Full-Stack AI Studio—tout en étant assis sur quelque chose de beaucoup plus effrayant

En bref

  • Anthropic prépare Claude Opus 4.7 et un outil de conception IA pour sites web et présentations
  • Claude Mythos reste le véritable modèle de frontière d’Anthropic, et la société ne le rendra pas public.
  • L’industrie ne peut toujours pas mesurer de manière fiable les progrès de l’IA, rendant les affirmations sur les gains d’Opus 4.7 difficiles à vérifier.

Anthropic se prépare à sortir Claude Opus 4.7 avec un nouvel outil de conception alimenté par l’IA qui permet aux utilisateurs de créer des sites web, des présentations et des pages d’atterrissage avec des prompts en anglais simple — une nouvelle qui a fait chuter les actions d’Adobe, Wix et Figma lundi, selon The Information. Les produits pourraient sortir dès cette semaine, a indiqué une personne au courant des plans à The Information. L’outil de conception cible à la fois les développeurs et les utilisateurs non techniques, le plaçant en collision avec des startups comme Gamma et Stitch de Google. Anthropic n’a pas répondu à la demande de commentaire de Decrypt.

Opus 4.7 n’est même pas le modèle le plus puissant d’Anthropic. Ce titre revient à Claude Mythos — une bête axée sur la cybersécurité que la société remet discrètement à des cabinets de sécurité sélectionnés tout en la gardant hors du public.  L’Institut de sécurité IA du Royaume-Uni a récemment évalué Mythos Preview et a constaté qu’il peut exécuter de manière autonome des cyberattaques sophistiquées à des taux qu’aucun autre modèle n’a égalés. Il est devenu le premier IA à réussir “The Last Ones”, une simulation d’attaque de réseau d’entreprise en 32 étapes qui prend généralement 20 heures à des équipes humaines. Mythos l’a réussi en trois tentatives sur dix, avec une moyenne de 22 sur 32 étapes — contre 16 pour Opus 4.6. Cela importe au-delà de la sécurité d’entreprise. Mesurer ce que l’IA peut réellement faire est devenu un casse-tête pour toute l’industrie. OpenAI a récemment qualifié le principal benchmark de codage de “contaminé”, pourtant les modèles continuent d’être comparés à l’aide de ces mêmes tests. Une évaluation ARC-AGI-3 distincte a vu Gemini obtenir 0,37 % et GPT-5.4 atteindre 0,26 % — alors que les humains ont obtenu 100 %. Le paysage actuel est celui où les benchmarks sont à la fois contestés et encore utilisés comme preuve, ce qui rend difficile de contextualiser les affirmations sur les progrès d’Opus 4.7 jusqu’à ce qu’Anthropic publie une fiche modèle détaillée.

La relation entre Opus et Mythos est plus étroite qu’on ne le pense. Anthropic construit ses modèles de frontière en affinant la ligne Opus — la même base qui alimente les produits publics Claude est testée sous pression et renforcée pour devenir Mythos. Opus 4.7 est la fondation sur laquelle le kung-fu en cybersécurité est finalement intégré. De plus, les efforts d’Anthropic se tournent davantage vers le développement et l’utilisation en entreprise. La fuite du code de Claude, la sortie du système de compétences et du protocole MCP, l’accent mis sur l’IA agentique et l’attention portée aux benchmarks de codage renforcent cette tendance. Bien qu’Anthropic ne l’ait pas officiellement annoncé, ces fuites confirment la transition plus large d’un fournisseur de LLM vers quelque chose qui ressemble à un modèle “studio IA” complet, où Claude ne se contente pas de générer du texte mais construit et déploie des produits complets.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler