Le gouvernement américain, citant les autorités de sécurité nationale, a publié une directive de contrôle des exportations pour suspendre tout accès à la Fable 5 et au Mythos 5 par tout ressortissant étranger, que ce soit à l'intérieur ou à l'extérieur des États-Unis, y compris les employés anthropiques étrangers. L'effet net de cette commande est que nous devons désactiver brusquement Fable 5 et Mythos 5 pour que tous nos clients assurent la conformité. L'accès à tous les autres modèles anthropopiques ne sera pas affecté.
Nous avons reçu la directive du gouvernement aujourd'hui à 17h21 (HE). La lettre ne fournissait pas de détails précis sur son souci de sécurité nationale. Nous comprenons que le gouvernement croit avoir pris conscience d’une méthode de contournement, ou « jailbreaking » Fable 5. Nous avons examiné une démonstration de cette technique spécifique utilisée pour identifier un petit nombre de vulnérabilités mineures précédemment connues. Ces vulnérabilités semblent toutes relativement simples, et nous avons constaté que d’autres modèles accessibles au public sont en mesure de les découvrir sans nécessiter de contournement.
La posture d’Anthropic en ce qui concerne les garanties de Fable, telles qu’elles sont énoncées dans notre article de blog de lancement, est la suivante:
Nous avons instauré des garanties solides qui réduisent considérablement la probabilité que Fable soit mal utilisé pour les tâches liées à la cybersécurité (entre autres). En fait, nos garde-fous sont si solides que de nombreux utilisateurs se sont plaints qu’ils sont trop larges.
Dans les semaines qui ont précédé le lancement de Fable, Anthropic a travaillé avec le gouvernement américain, l’AISI britannique, plusieurs organisations tierces privées et des équipes internes aux garanties de l’équipe rouge de Fable pendant des milliers d’heures au total.
Ces tests ont montré que les garanties de Fable sont nettement plus efficaces que celles de tout modèle précédemment déployé.
Aucun testeur n’a encore été en mesure de trouver un jailbreak universel – une méthode jailbreak qui peut très largement contourner les garanties du modèle, débloquant un large éventail de cybercapacités.
Nous soupçonnons que la résistance parfaite au jailbreak n'est actuellement possible pour aucun fournisseur de modèle. Chaque protection utilisée dans l'industrie est vulnérable aux jailbreaks non universels (ce qui peut susciter certaines informations cybernétiques dans des circonstances spécifiques), et il est probable que des jailbreaks universels seront éventuellement trouvés à l'avenir. Nous l'avons clairement dit lorsque nous avons publié Fable 5.
Étant donné que la résistance parfaite au jailbreak ne semble pas possible aujourd'hui, Anthropic a adopté une stratégie de défense en profondeur avec la Fable 5. Nous avons cherché à rendre les jailbreaks soit étroits (dans le cas des jailbreaks non universels) ou très coûteux à produire (dans le cas des jailbreaks universels), et à combiner cela avec une surveillance approfondie pour détecter et arrêter rapidement toute attaque réussie. C’est également la raison pour laquelle Anthropic a eu besoin d’une rétention de 30 jours de données clients avec Fable – un changement de politique qui entraîne de réels coûts pour nous avec les clients, mais qui nous permet de rechercher et d’atténuer les jailbreaks.
Nous respectons cette stratégie de défense en profondeur. Il réduit les risques posés par Fable, les rendant comparables aux risques des modèles existants déjà déployés dans l'ensemble de l'industrie.
Nous n'avons même pas reçu de divulgation d'un jailbreak potentiel non universel préoccupant qui a conduit à un résultat préjudiciable. Les jailbreaks potentiels qui nous ont été divulgués sont soit des réponses entièrement bénignes, soit des conclusions mineures qui ne fournissent aucun soulèvement spécifique au Mythos.
À ce jour, le gouvernement ne nous a donné que des preuves verbales d'un jailbreak étroit et non universel potentiel, qui consiste essentiellement à demander au modèle de lire une base de code spécifique et de corriger les défauts logiciels. Notre compréhension est qu'un jailbreak potentiel a été partagé avec le gouvernement. Nous avons examiné un rapport qui, selon nous, est à la base de la directive du gouvernement et a validé que le niveau de capacité qui y est affiché est largement disponible à partir d'autres modèles (y compris le GPT-5.5 d'OpenAI), et est utilisé chaque jour par les défenseurs qui protègent les systèmes. Nous partagerons plus de détails au cours des prochaines 24 heures.
Nous nous conformons à la directive légale du gouvernement et supprimons l’accès à la Fable 5 et au Mythos 5 pour tous les utilisateurs. Cependant, nous ne sommes pas d'accord sur le fait que la conclusion d'un jailbreak potentiel étroit devrait être un motif de rappel d'un modèle commercial déployé auprès de centaines de millions de personnes. Si cette norme était appliquée dans l'ensemble de l'industrie, nous pensons qu'elle arrêterait essentiellement tous les nouveaux déploiements de modèles pour tous les fournisseurs de modèles frontaliers.
Comme nous l'avons déclaré publiquement, nous croyons que le gouvernement devrait avoir la capacité de bloquer les déploiements dangereux, dans le cadre d'un processus législatif transparent, équitable, clair et fondé sur des faits techniques. Cette action ne respecte pas ces principes.
Nous nous excusons pour cette perturbation pour nos clients. Nous croyons qu'il s'agit d'un malentendu et que nous travaillons à restaurer l'accès dès que possible.
Article traduis : version originale https://www.anthropic.com/news/fable-mythos-access
Nous avons reçu la directive du gouvernement aujourd'hui à 17h21 (HE). La lettre ne fournissait pas de détails précis sur son souci de sécurité nationale. Nous comprenons que le gouvernement croit avoir pris conscience d’une méthode de contournement, ou « jailbreaking » Fable 5. Nous avons examiné une démonstration de cette technique spécifique utilisée pour identifier un petit nombre de vulnérabilités mineures précédemment connues. Ces vulnérabilités semblent toutes relativement simples, et nous avons constaté que d’autres modèles accessibles au public sont en mesure de les découvrir sans nécessiter de contournement.
La posture d’Anthropic en ce qui concerne les garanties de Fable, telles qu’elles sont énoncées dans notre article de blog de lancement, est la suivante:
Nous avons instauré des garanties solides qui réduisent considérablement la probabilité que Fable soit mal utilisé pour les tâches liées à la cybersécurité (entre autres). En fait, nos garde-fous sont si solides que de nombreux utilisateurs se sont plaints qu’ils sont trop larges.
Dans les semaines qui ont précédé le lancement de Fable, Anthropic a travaillé avec le gouvernement américain, l’AISI britannique, plusieurs organisations tierces privées et des équipes internes aux garanties de l’équipe rouge de Fable pendant des milliers d’heures au total.
Ces tests ont montré que les garanties de Fable sont nettement plus efficaces que celles de tout modèle précédemment déployé.
Aucun testeur n’a encore été en mesure de trouver un jailbreak universel – une méthode jailbreak qui peut très largement contourner les garanties du modèle, débloquant un large éventail de cybercapacités.
Nous soupçonnons que la résistance parfaite au jailbreak n'est actuellement possible pour aucun fournisseur de modèle. Chaque protection utilisée dans l'industrie est vulnérable aux jailbreaks non universels (ce qui peut susciter certaines informations cybernétiques dans des circonstances spécifiques), et il est probable que des jailbreaks universels seront éventuellement trouvés à l'avenir. Nous l'avons clairement dit lorsque nous avons publié Fable 5.
Étant donné que la résistance parfaite au jailbreak ne semble pas possible aujourd'hui, Anthropic a adopté une stratégie de défense en profondeur avec la Fable 5. Nous avons cherché à rendre les jailbreaks soit étroits (dans le cas des jailbreaks non universels) ou très coûteux à produire (dans le cas des jailbreaks universels), et à combiner cela avec une surveillance approfondie pour détecter et arrêter rapidement toute attaque réussie. C’est également la raison pour laquelle Anthropic a eu besoin d’une rétention de 30 jours de données clients avec Fable – un changement de politique qui entraîne de réels coûts pour nous avec les clients, mais qui nous permet de rechercher et d’atténuer les jailbreaks.
Nous respectons cette stratégie de défense en profondeur. Il réduit les risques posés par Fable, les rendant comparables aux risques des modèles existants déjà déployés dans l'ensemble de l'industrie.
Nous n'avons même pas reçu de divulgation d'un jailbreak potentiel non universel préoccupant qui a conduit à un résultat préjudiciable. Les jailbreaks potentiels qui nous ont été divulgués sont soit des réponses entièrement bénignes, soit des conclusions mineures qui ne fournissent aucun soulèvement spécifique au Mythos.
À ce jour, le gouvernement ne nous a donné que des preuves verbales d'un jailbreak étroit et non universel potentiel, qui consiste essentiellement à demander au modèle de lire une base de code spécifique et de corriger les défauts logiciels. Notre compréhension est qu'un jailbreak potentiel a été partagé avec le gouvernement. Nous avons examiné un rapport qui, selon nous, est à la base de la directive du gouvernement et a validé que le niveau de capacité qui y est affiché est largement disponible à partir d'autres modèles (y compris le GPT-5.5 d'OpenAI), et est utilisé chaque jour par les défenseurs qui protègent les systèmes. Nous partagerons plus de détails au cours des prochaines 24 heures.
Nous nous conformons à la directive légale du gouvernement et supprimons l’accès à la Fable 5 et au Mythos 5 pour tous les utilisateurs. Cependant, nous ne sommes pas d'accord sur le fait que la conclusion d'un jailbreak potentiel étroit devrait être un motif de rappel d'un modèle commercial déployé auprès de centaines de millions de personnes. Si cette norme était appliquée dans l'ensemble de l'industrie, nous pensons qu'elle arrêterait essentiellement tous les nouveaux déploiements de modèles pour tous les fournisseurs de modèles frontaliers.
Comme nous l'avons déclaré publiquement, nous croyons que le gouvernement devrait avoir la capacité de bloquer les déploiements dangereux, dans le cadre d'un processus législatif transparent, équitable, clair et fondé sur des faits techniques. Cette action ne respecte pas ces principes.
Nous nous excusons pour cette perturbation pour nos clients. Nous croyons qu'il s'agit d'un malentendu et que nous travaillons à restaurer l'accès dès que possible.
Article traduis : version originale https://www.anthropic.com/news/fable-mythos-access