Claude Mythos & Project Glasswing : L'IA Trop Puissante
By Dorian Laurenceau
Claude Mythos & Project Glasswing : L'IA Trop Puissante pour Être Rendue Publique
📅 Dernière révision : 24 avril 2026. Mise à jour avec les retours et observations d'avril 2026.
📚 Articles liés : Guide Claude Opus 4.6 | Opus 4.6 vs GPT-5.3 Codex | Comment Choisir le Bon LLM
Le 7 avril 2026, Anthropic a annoncé Project Glasswing, un programme de partenariat construit autour de Claude Mythos, leur modèle le plus puissant. Mythos se situe au-dessus du tier Opus, pulvérise tous les benchmarks existants, et a trouvé des failles de sécurité critiques cachées dans les logiciels open-source depuis jusqu'à 27 ans.
Le fait inédit : Anthropic ne rend pas Mythos accessible au grand public. L'accès est limité à 12 partenaires de sécurité vérifiés, AWS, Apple, Google, Microsoft, CrowdStrike, entre autres, qui l'utiliseront exclusivement pour la cybersécurité défensive.
C'est la première fois qu'un grand labo d'IA construit un modèle frontier et choisit délibérément de ne pas le distribuer. Dans ce guide, nous expliquons ce que Mythos peut faire, pourquoi Anthropic a pris cette décision, et ce que cela signifie pour l'avenir du développement de l'IA.
Qu'est-ce que Claude Mythos ?
Claude Mythos est le modèle frontier à usage général d'Anthropic, pas un outil de cybersécurité spécialisé, mais une IA polyvalente qui se trouve être exceptionnellement douée pour trouver des vulnérabilités. Il représente un nouveau tier au-dessus d'Opus, entraîné avec des techniques qui poussent les performances bien au-delà de ce qu'Opus 4.6 peut atteindre.
Chiffres clés
| Spécification | Claude Mythos | Claude Opus 4.6 |
|---|---|---|
| Tier | Au-dessus d'Opus (nouveau) | Opus |
| SWE-bench Verified | 93.9% | 80.8% |
| Terminal-Bench 2.0 | 82% | 65.4% |
| GPQA Diamond | 94.6% | 91.3% |
| OSWorld | 79.6% | 72.7% |
| CyberGym | 83.1% | 66.6% |
| Prix en entrée | 25$/M tokens | 5$/M tokens |
| Prix en sortie | 125$/M tokens | 25$/M tokens |
| Accès public | ❌ Partenaires uniquement | ✅ Disponibilité générale |
La lecture honnête de « Claude Mythos » et des annonces Project Glasswing, telle que les threads r/ClaudeAI et r/cybersecurity l'ont correctement relevée : un modèle d'IA capable de trouver fiablement des zero-days est aussi un modèle qui ne devrait pas être un produit grand public, quelles que soient les intentions du vendeur. Le choix d'Anthropic de retenir Mythos fait écho au cadre d'évaluation de l'AI Safety Institute et aux normes de divulgation responsable qui tiennent la communauté sécurité depuis des décennies. Ce n'est pas du théâtre RP ; c'est la première instance publique d'un laboratoire frontière qui traite la découverte de capacités offensives comme une raison de restreindre l'accès, et non comme une feature de lancement.
Là où la communauté nuance à juste titre le récit : « Anthropic a trouvé des milliers de zero-days » est une affirmation qui mérite le même examen que toute découverte sécurité — vérification indépendante, attribution CVE, divulgation coordonnée avec les éditeurs concernés, et éventuels writeups publics. Le programme CVE de MITRE et la ligne de temps de divulgation de Project Zero sont les standards durables ici. Tant que ceux-ci n'apparaissent pas, la lecture honnête est que Mythos est plausiblement une capacité significative, et que l'histoire publique complète reste à écrire.
Le point plus large que la communauté soulève régulièrement : la découverte de vulnérabilités accélérée par IA est inévitable, et la vraie question n'est pas de savoir si ça arrive, mais si le côté défensif (Glasswing, red teams internes, pipelines de vendeurs sécurité) peut avancer à la même vitesse que le côté offensif.
Project Glasswing : La Sécurité IA Défensive
Au lieu d'enterrer Mythos ou de le publier imprudemment, Anthropic a créé Project Glasswing, un programme de partenariat structuré où des organisations vérifiées utilisent Mythos exclusivement pour trouver et corriger des vulnérabilités.
La découverte qui a tout changé
Pendant les tests internes, Mythos a trouvé des vulnérabilités que les chercheurs en sécurité humains avaient manquées pendant des décennies :
- →Un bug de 27 ans dans OpenBSD, l'un des systèmes d'exploitation les plus audités au monde en matière de sécurité
- →Une vulnérabilité de 16 ans dans FFmpeg, le framework média utilisé par quasiment toutes les applications vidéo
- →Des chaînes d'exploitation dans le noyau Linux combinables pour une élévation de privilèges
- →Des milliers d'autres zero-days à travers les navigateurs, systèmes d'exploitation et logiciels d'infrastructure critique
Partenaires de lancement
12 organisations ont un accès direct à Mythos via Glasswing :
| Partenaire | Rôle | Domaine de focus |
|---|---|---|
| AWS | Infrastructure cloud | Sécurité des services cloud |
| Apple | Hardware/software grand public | Scan de vulnérabilités macOS, iOS |
| Recherche, cloud, Android | Sécurité Chromium, Android, cloud | |
| Microsoft | Logiciels entreprise | Sécurité Windows, Azure, Office |
| CrowdStrike | Entreprise de cybersécurité | Protection endpoint, threat intelligence |
| Palo Alto Networks | Sécurité réseau | Pare-feu, sécurité cloud |
| + 6 autres | Divers | Entreprise et gouvernement |
40+ organisations supplémentaires ont candidaté et sont en cours de vérification.
Performance sur les Benchmarks
Mythos ne se contente pas de dominer les benchmarks, il redéfinit l'échelle. L'écart entre Mythos et le deuxième meilleur modèle est plus grand que l'écart entre Opus 4.6 et les modèles de milieu de gamme.
Ce que ces chiffres signifient
SWE-bench Verified (93.9%), Face à un vrai bug GitHub, Mythos écrit le correctif exact 94 fois sur 100. Opus 4.6 le fait 81 fois. Cet écart de 13 points est énorme à ce niveau de performance.
Terminal-Bench 2.0 (82%), Le benchmark de coding agentique le plus exigeant, où les modèles doivent naviguer dans de vrais environnements terminal, déboguer des erreurs et accomplir des tâches multi-étapes. Mythos devance de 17 points.
CyberGym (83.1%), Conçu spécifiquement pour évaluer l'IA sur la détection de vraies vulnérabilités. Mythos dépasse Opus 4.6 de 17 points, confirmant ses capacités exceptionnelles en sécurité.
Pourquoi Restreindre un Modèle ?
C'est la première fois qu'un grand labo d'IA construit un modèle frontier à usage général et en restreint délibérément l'accès au public. Comprendre le raisonnement d'Anthropic révèle des leçons importantes sur la sécurité de l'IA.
Le problème du double usage
Mythos peut trouver des vulnérabilités de manière défensive (les corriger) ou offensive (les exploiter). La même capacité qui le rend inestimable pour les équipes de sécurité le rend dangereux entre de mauvaises mains.
La stratégie en trois volets d'Anthropic
- →Accès restreint, Uniquement les partenaires vérifiés via Glasswing. Pas d'API publique, pas d'accès grand public.
- →Engagement financier, 100 millions de dollars en crédits pour les partenaires et 4 millions pour les projets de sécurité open-source.
- →Divulgation responsable, Toutes les vulnérabilités découvertes par Mythos doivent être signalées aux mainteneurs avant toute discussion publique.
La Fuite « Capybara »
En mars 2026, un incident de données a exposé des documents internes d'Anthropic faisant référence à un modèle nommé « Capybara » avec des capacités inhabituelles en cybersécurité. La fuite incluait des scores de benchmarks dépassant largement tout modèle public et des références à des découvertes de vulnérabilités.
Anthropic a d'abord refusé de commenter. Après que des chercheurs indépendants ont confirmé les scores annoncés, Anthropic a accéléré l'annonce de Project Glasswing, l'avançant de plusieurs semaines.
L'incident a soulevé des questions importantes :
- →La sécurité des labos d'IA eux-mêmes, Si une entreprise d'IA ne peut pas protéger ses propres secrets, comment lui faire confiance avec des décisions à l'échelle de la société ?
- →Les délais de divulgation responsable, Anthropic aurait-il dû annoncer Glasswing avant la fuite ?
- →La dynamique concurrentielle, Les concurrents pourraient maintenant se précipiter pour construire des capacités similaires sans la prudence d'Anthropic
Tarification et Économie
Mythos est le modèle IA le plus cher avec un prix public :
| Modèle | Entrée (par M tokens) | Sortie (par M tokens) | Ratio vs Opus 4.6 |
|---|---|---|---|
| Claude Mythos | 25$ | 125$ | 5× |
| Claude Opus 4.6 | 5$ | 25$ | 1× (référence) |
| GPT-5.3 Codex | 10$ | 30$ | ~2× |
| Gemini 3.1 Pro | 3.50$ | 10.50$ | ~0.7× |
Engagements financiers
- →100 millions de dollars en crédits d'utilisation répartis entre les partenaires Glasswing
- →4 millions de dollars en subventions spécifiquement pour les projets de sécurité open-source
- →Tarification structurée pour rendre le scan de sécurité intensif économiquement viable pour les partenaires
Ce que Cela Signifie pour les Développeurs
Si vous êtes un professionnel de la sécurité
Project Glasswing est probablement le développement le plus significatif en sécurité assistée par IA depuis l'invention du fuzzing. Si votre organisation est éligible, candidatez pour l'accès Glasswing. Même sans accès direct à Mythos, attendez-vous à ce que les vulnérabilités qu'il trouve génèrent une vague de patchs à travers les projets majeurs dans les mois à venir.
Si vous utilisez Claude pour coder
Opus 4.6 reste votre modèle. Son score de 80.8% sur SWE-bench et sa disponibilité générale en font le meilleur choix pour le développement quotidien. Mythos ne viendra pas sur Claude.ai, Claude Code, ni l'API publique de sitôt.
Si vous construisez des produits IA
Mythos prouve que les modèles frontier continuent de progresser rapidement. Si votre produit dépend des capacités IA, préparez-vous à des modèles 15 à 25% meilleurs en code, raisonnement et analyse tous les 3 à 6 mois. Le bond d'Opus 4.6 à Mythos suggère que le prochain modèle publiquement disponible sera significativement plus capable.
La Vision d'Ensemble : IA et Cybersécurité
Mythos représente un tournant pour trois conversations majeures :
1. La croissance des capacités IA s'accélère
Le bond d'Opus 4.6 (février 2026) à Mythos (avril 2026) est la plus grande progression en deux mois de l'histoire de l'IA frontier. Ce rythme a des implications pour chaque industrie.
2. Le débat sécurité vs accès devient concret
Pendant des années, les discussions sur la sécurité de l'IA étaient théoriques : « Et si un modèle pouvait faire X ? » Mythos rend le sujet concret : « Ce modèle peut trouver des zero-days dans tous les OS majeurs. Qu'est-ce qu'on fait ? » Anthropic a choisi la restriction. Tout le monde ne sera pas d'accord.
3. La défense devance l'attaque (pour l'instant)
En trouvant les vulnérabilités avant les attaquants, Mythos penche la balance de la cybersécurité du côté des défenseurs, mais uniquement si l'accès reste restreint. Si des capacités similaires fuient ou sont répliquées sans contrôles de sécurité, l'avantage s'inverse.
En résumé
Claude Mythos est le modèle IA le plus capable jamais construit, et le premier délibérément tenu hors de la portée du public. Project Glasswing est le pari d'Anthropic que certaines capacités sont mieux déployées via des partenaires de confiance qu'en accès libre. Que ce modèle devienne un modèle de déploiement responsable de l'IA ou un exemple de prudence excessive dépendra de la suite : combien de vulnérabilités seront corrigées, si les concurrents suivront l'approche d'Anthropic, et si les capacités de niveau Mythos atteindront un jour le public sous une forme plus sûre.
Pour l'instant, Opus 4.6 reste le modèle Claude le plus puissant que vous puissiez réellement utiliser. Mais Mythos montre où l'IA se dirige, et elle se dirige vite.
Module 4 — Chaining & Routing
Build multi-step prompt workflows with conditional logic.
Dorian Laurenceau
Full-Stack Developer & Learning DesignerFull-stack web developer and learning designer. I spent 4 years as a freelance full-stack developer and 4 years teaching React, JavaScript, HTML/CSS and WordPress to adult learners. Today I design learning paths in web development and AI, grounded in learning science. I founded learn-prompting.fr to make AI practical and accessible, and built the Bluff app to gamify political transparency.
Weekly AI Insights
Tools, techniques & news — curated for AI practitioners. Free, no spam.
Free, no spam. Unsubscribe anytime.
→Related Articles
FAQ
Qu'est-ce que Claude Mythos ?+
Claude Mythos est le modèle IA le plus puissant d'Anthropic, annoncé le 7 avril 2026 via Project Glasswing. Il se situe au-dessus du tier Opus avec 93.9% sur SWE-bench Verified, un bond de 13 points par rapport à Opus 4.6. Il n'est pas accessible au public en raison de ses capacités en cybersécurité.
Pourquoi Claude Mythos n'est-il pas accessible au public ?+
Mythos a découvert des milliers de vulnérabilités zero-day, dont un bug vieux de 27 ans dans OpenBSD et un de 16 ans dans FFmpeg. Anthropic restreint l'accès tant que les garde-fous de cybersécurité ne sont pas en place, limitant l'utilisation aux partenaires de sécurité vérifiés.
Qu'est-ce que Project Glasswing ?+
Project Glasswing est l'initiative d'Anthropic pour utiliser Claude Mythos en cybersécurité défensive. 12 partenaires de lancement, dont AWS, Apple, Google, Microsoft et CrowdStrike, reçoivent un accès pour déployer Mythos dans la détection de vulnérabilités.
Comment Claude Mythos se compare-t-il à Claude Opus 4.6 ?+
Mythos surpasse Opus 4.6 sur tous les benchmarks majeurs : 93.9% contre 80.8% sur SWE-bench Verified, 82% contre 65.4% sur Terminal-Bench 2.0, 94.6% contre 91.3% sur GPQA Diamond, et 79.6% contre 72.7% sur OSWorld. Il coûte 5 fois plus cher.
Combien coûte Claude Mythos ?+
Claude Mythos coûte 25$ par million de tokens en entrée et 125$ par million en sortie, 5 fois plus cher qu'Opus 4.6. Anthropic fournit 100 millions de dollars en crédits d'utilisation aux partenaires et 4 millions pour les projets open-source de sécurité.
Quels benchmarks Claude Mythos domine-t-il ?+
Mythos domine SWE-bench Verified (93.9%), Terminal-Bench 2.0 (82%), SWE-bench Pro (77.8%), GPQA Diamond (94.6%), HLE avec outils (64.7%), BrowseComp (86.9%), OSWorld (79.6%) et CyberGym (83.1%).
Claude Mythos a-t-il été divulgué avant son annonce officielle ?+
Oui. En mars 2026, un incident de données a révélé un modèle nommé 'Capybara' avec des capacités inhabituelles en cybersécurité. Anthropic a confirmé qu'il s'agissait d'une version préliminaire de Mythos et a accéléré l'annonce de Project Glasswing.