Claude Mythos & Project Glasswing : L'IA Trop Puissante pour Être Rendue Publique (Avril 2026)
By Learnia Team
Claude Mythos & Project Glasswing : L'IA Trop Puissante pour Être Rendue Publique
Cet article est rédigé en français. Nos modules de formation sont disponibles en plusieurs langues.
📅 Dernière mise à jour : 8 avril 2026 — Annoncé le 7 avril 2026. Non disponible publiquement.
📚 Articles liés : Guide Claude Opus 4.6 | Opus 4.6 vs GPT-5.3 Codex | Comment Choisir le Bon LLM
Le 7 avril 2026, Anthropic a annoncé Project Glasswing — un programme de partenariat construit autour de Claude Mythos, leur modèle le plus puissant. Mythos se situe au-dessus du tier Opus, pulvérise tous les benchmarks existants, et a trouvé des failles de sécurité critiques cachées dans les logiciels open-source depuis jusqu'à 27 ans.
Le fait inédit : Anthropic ne rend pas Mythos accessible au grand public. L'accès est limité à 12 partenaires de sécurité vérifiés — AWS, Apple, Google, Microsoft, CrowdStrike, entre autres — qui l'utiliseront exclusivement pour la cybersécurité défensive.
C'est la première fois qu'un grand labo d'IA construit un modèle frontier et choisit délibérément de ne pas le distribuer. Dans ce guide, nous expliquons ce que Mythos peut faire, pourquoi Anthropic a pris cette décision, et ce que cela signifie pour l'avenir du développement de l'IA.
Qu'est-ce que Claude Mythos ?
Claude Mythos est le modèle frontier à usage général d'Anthropic — pas un outil de cybersécurité spécialisé, mais une IA polyvalente qui se trouve être exceptionnellement douée pour trouver des vulnérabilités. Il représente un nouveau tier au-dessus d'Opus, entraîné avec des techniques qui poussent les performances bien au-delà de ce qu'Opus 4.6 peut atteindre.
Chiffres clés
| Spécification | Claude Mythos | Claude Opus 4.6 |
|---|---|---|
| Tier | Au-dessus d'Opus (nouveau) | Opus |
| SWE-bench Verified | 93.9% | 80.8% |
| Terminal-Bench 2.0 | 82% | 65.4% |
| GPQA Diamond | 94.6% | 91.3% |
| OSWorld | 79.6% | 72.7% |
| CyberGym | 83.1% | 66.6% |
| Prix en entrée | 25$/M tokens | 5$/M tokens |
| Prix en sortie | 125$/M tokens | 25$/M tokens |
| Accès public | ❌ Partenaires uniquement | ✅ Disponibilité générale |
Project Glasswing : La Sécurité IA Défensive
Au lieu d'enterrer Mythos ou de le publier imprudemment, Anthropic a créé Project Glasswing — un programme de partenariat structuré où des organisations vérifiées utilisent Mythos exclusivement pour trouver et corriger des vulnérabilités.
La découverte qui a tout changé
Pendant les tests internes, Mythos a trouvé des vulnérabilités que les chercheurs en sécurité humains avaient manquées pendant des décennies :
- →Un bug de 27 ans dans OpenBSD — l'un des systèmes d'exploitation les plus audités au monde en matière de sécurité
- →Une vulnérabilité de 16 ans dans FFmpeg — le framework média utilisé par quasiment toutes les applications vidéo
- →Des chaînes d'exploitation dans le noyau Linux combinables pour une élévation de privilèges
- →Des milliers d'autres zero-days à travers les navigateurs, systèmes d'exploitation et logiciels d'infrastructure critique
Partenaires de lancement
12 organisations ont un accès direct à Mythos via Glasswing :
| Partenaire | Rôle | Domaine de focus |
|---|---|---|
| AWS | Infrastructure cloud | Sécurité des services cloud |
| Apple | Hardware/software grand public | Scan de vulnérabilités macOS, iOS |
| Recherche, cloud, Android | Sécurité Chromium, Android, cloud | |
| Microsoft | Logiciels entreprise | Sécurité Windows, Azure, Office |
| CrowdStrike | Entreprise de cybersécurité | Protection endpoint, threat intelligence |
| Palo Alto Networks | Sécurité réseau | Pare-feu, sécurité cloud |
| + 6 autres | Divers | Entreprise et gouvernement |
40+ organisations supplémentaires ont candidaté et sont en cours de vérification.
Performance sur les Benchmarks
Mythos ne se contente pas de dominer les benchmarks — il redéfinit l'échelle. L'écart entre Mythos et le deuxième meilleur modèle est plus grand que l'écart entre Opus 4.6 et les modèles de milieu de gamme.
Ce que ces chiffres signifient
SWE-bench Verified (93.9%) — Face à un vrai bug GitHub, Mythos écrit le correctif exact 94 fois sur 100. Opus 4.6 le fait 81 fois. Cet écart de 13 points est énorme à ce niveau de performance.
Terminal-Bench 2.0 (82%) — Le benchmark de coding agentique le plus exigeant, où les modèles doivent naviguer dans de vrais environnements terminal, déboguer des erreurs et accomplir des tâches multi-étapes. Mythos devance de 17 points.
CyberGym (83.1%) — Conçu spécifiquement pour évaluer l'IA sur la détection de vraies vulnérabilités. Mythos dépasse Opus 4.6 de 17 points, confirmant ses capacités exceptionnelles en sécurité.
Pourquoi Restreindre un Modèle ?
C'est la première fois qu'un grand labo d'IA construit un modèle frontier à usage général et en restreint délibérément l'accès au public. Comprendre le raisonnement d'Anthropic révèle des leçons importantes sur la sécurité de l'IA.
Le problème du double usage
Mythos peut trouver des vulnérabilités de manière défensive (les corriger) ou offensive (les exploiter). La même capacité qui le rend inestimable pour les équipes de sécurité le rend dangereux entre de mauvaises mains.
La stratégie en trois volets d'Anthropic
- →Accès restreint — Uniquement les partenaires vérifiés via Glasswing. Pas d'API publique, pas d'accès grand public.
- →Engagement financier — 100 millions de dollars en crédits pour les partenaires et 4 millions pour les projets de sécurité open-source.
- →Divulgation responsable — Toutes les vulnérabilités découvertes par Mythos doivent être signalées aux mainteneurs avant toute discussion publique.
La Fuite « Capybara »
En mars 2026, un incident de données a exposé des documents internes d'Anthropic faisant référence à un modèle nommé « Capybara » avec des capacités inhabituelles en cybersécurité. La fuite incluait des scores de benchmarks dépassant largement tout modèle public et des références à des découvertes de vulnérabilités.
Anthropic a d'abord refusé de commenter. Après que des chercheurs indépendants ont confirmé les scores annoncés, Anthropic a accéléré l'annonce de Project Glasswing — l'avançant de plusieurs semaines.
L'incident a soulevé des questions importantes :
- →La sécurité des labos d'IA eux-mêmes — Si une entreprise d'IA ne peut pas protéger ses propres secrets, comment lui faire confiance avec des décisions à l'échelle de la société ?
- →Les délais de divulgation responsable — Anthropic aurait-il dû annoncer Glasswing avant la fuite ?
- →La dynamique concurrentielle — Les concurrents pourraient maintenant se précipiter pour construire des capacités similaires sans la prudence d'Anthropic
Tarification et Économie
Mythos est le modèle IA le plus cher avec un prix public :
| Modèle | Entrée (par M tokens) | Sortie (par M tokens) | Ratio vs Opus 4.6 |
|---|---|---|---|
| Claude Mythos | 25$ | 125$ | 5× |
| Claude Opus 4.6 | 5$ | 25$ | 1× (référence) |
| GPT-5.3 Codex | 10$ | 30$ | ~2× |
| Gemini 3.1 Pro | 3.50$ | 10.50$ | ~0.7× |
Engagements financiers
- →100 millions de dollars en crédits d'utilisation répartis entre les partenaires Glasswing
- →4 millions de dollars en subventions spécifiquement pour les projets de sécurité open-source
- →Tarification structurée pour rendre le scan de sécurité intensif économiquement viable pour les partenaires
Ce que Cela Signifie pour les Développeurs
Si vous êtes un professionnel de la sécurité
Project Glasswing est probablement le développement le plus significatif en sécurité assistée par IA depuis l'invention du fuzzing. Si votre organisation est éligible, candidatez pour l'accès Glasswing. Même sans accès direct à Mythos, attendez-vous à ce que les vulnérabilités qu'il trouve génèrent une vague de patchs à travers les projets majeurs dans les mois à venir.
Si vous utilisez Claude pour coder
Opus 4.6 reste votre modèle. Son score de 80.8% sur SWE-bench et sa disponibilité générale en font le meilleur choix pour le développement quotidien. Mythos ne viendra pas sur Claude.ai, Claude Code, ni l'API publique de sitôt.
Si vous construisez des produits IA
Mythos prouve que les modèles frontier continuent de progresser rapidement. Si votre produit dépend des capacités IA, préparez-vous à des modèles 15 à 25% meilleurs en code, raisonnement et analyse tous les 3 à 6 mois. Le bond d'Opus 4.6 à Mythos suggère que le prochain modèle publiquement disponible sera significativement plus capable.
La Vision d'Ensemble : IA et Cybersécurité
Mythos représente un tournant pour trois conversations majeures :
1. La croissance des capacités IA s'accélère
Le bond d'Opus 4.6 (février 2026) à Mythos (avril 2026) est la plus grande progression en deux mois de l'histoire de l'IA frontier. Ce rythme a des implications pour chaque industrie.
2. Le débat sécurité vs accès devient concret
Pendant des années, les discussions sur la sécurité de l'IA étaient théoriques : « Et si un modèle pouvait faire X ? » Mythos rend le sujet concret : « Ce modèle peut trouver des zero-days dans tous les OS majeurs. Qu'est-ce qu'on fait ? » Anthropic a choisi la restriction. Tout le monde ne sera pas d'accord.
3. La défense devance l'attaque (pour l'instant)
En trouvant les vulnérabilités avant les attaquants, Mythos penche la balance de la cybersécurité du côté des défenseurs — mais uniquement si l'accès reste restreint. Si des capacités similaires fuient ou sont répliquées sans contrôles de sécurité, l'avantage s'inverse.
Conclusion
Claude Mythos est le modèle IA le plus capable jamais construit — et le premier délibérément tenu hors de la portée du public. Project Glasswing est le pari d'Anthropic que certaines capacités sont mieux déployées via des partenaires de confiance qu'en accès libre. Que ce modèle devienne un modèle de déploiement responsable de l'IA ou un exemple de prudence excessive dépendra de la suite : combien de vulnérabilités seront corrigées, si les concurrents suivront l'approche d'Anthropic, et si les capacités de niveau Mythos atteindront un jour le public sous une forme plus sûre.
Pour l'instant, Opus 4.6 reste le modèle Claude le plus puissant que vous puissiez réellement utiliser. Mais Mythos montre où l'IA se dirige — et elle se dirige vite.
Module 4 — Chaining & Routing
Build multi-step prompt workflows with conditional logic.
Weekly AI Insights
Tools, techniques & news — curated for AI practitioners. Free, no spam.
Free, no spam. Unsubscribe anytime.
→Related Articles
Reddition Cognitive : Pourquoi 73% des Gens Font Confiance à l'IA Même Quand Elle Se Trompe (Étude 2026)
GEN-1 : Le Moment GPT-3 de la Robotique — Des Robots Qui Apprennent de Leurs Erreurs (2026)
MemPalace : Le Système de Mémoire IA Open-Source Qui Score 96.6% — Guide Complet (2026)
FAQ
Qu'est-ce que Claude Mythos ?+
Claude Mythos est le modèle IA le plus puissant d'Anthropic, annoncé le 7 avril 2026 via Project Glasswing. Il se situe au-dessus du tier Opus avec 93.9% sur SWE-bench Verified — un bond de 13 points par rapport à Opus 4.6. Il n'est pas accessible au public en raison de ses capacités en cybersécurité.
Pourquoi Claude Mythos n'est-il pas accessible au public ?+
Mythos a découvert des milliers de vulnérabilités zero-day, dont un bug vieux de 27 ans dans OpenBSD et un de 16 ans dans FFmpeg. Anthropic restreint l'accès tant que les garde-fous de cybersécurité ne sont pas en place, limitant l'utilisation aux partenaires de sécurité vérifiés.
Qu'est-ce que Project Glasswing ?+
Project Glasswing est l'initiative d'Anthropic pour utiliser Claude Mythos en cybersécurité défensive. 12 partenaires de lancement — dont AWS, Apple, Google, Microsoft et CrowdStrike — reçoivent un accès pour déployer Mythos dans la détection de vulnérabilités.
Comment Claude Mythos se compare-t-il à Claude Opus 4.6 ?+
Mythos surpasse Opus 4.6 sur tous les benchmarks majeurs : 93.9% contre 80.8% sur SWE-bench Verified, 82% contre 65.4% sur Terminal-Bench 2.0, 94.6% contre 91.3% sur GPQA Diamond, et 79.6% contre 72.7% sur OSWorld. Il coûte 5 fois plus cher.
Combien coûte Claude Mythos ?+
Claude Mythos coûte 25$ par million de tokens en entrée et 125$ par million en sortie — 5 fois plus cher qu'Opus 4.6. Anthropic fournit 100 millions de dollars en crédits d'utilisation aux partenaires et 4 millions pour les projets open-source de sécurité.
Quels benchmarks Claude Mythos domine-t-il ?+
Mythos domine SWE-bench Verified (93.9%), Terminal-Bench 2.0 (82%), SWE-bench Pro (77.8%), GPQA Diamond (94.6%), HLE avec outils (64.7%), BrowseComp (86.9%), OSWorld (79.6%) et CyberGym (83.1%).
Claude Mythos a-t-il été divulgué avant son annonce officielle ?+
Oui. En mars 2026, un incident de données a révélé un modèle nommé 'Capybara' avec des capacités inhabituelles en cybersécurité. Anthropic a confirmé qu'il s'agissait d'une version préliminaire de Mythos et a accéléré l'annonce de Project Glasswing.