Claude Mythos nuovo modello Anthropic, fuga di dati rivela dettagli sul suo potere e sui rischi

Anthropic lavora al nuovo super‑modello Claude Mythos dopo fuga di dati
Anthropic, laboratorio di intelligenza artificiale fondato da ex dirigenti di OpenAI, sta testando in accesso anticipato un nuovo modello di AI, nome in codice Claude Mythos o Capybara, potenzialmente più potente di qualsiasi sistema finora rilasciato.
La sua esistenza, le capacità avanzate in programmazione, ragionamento e soprattutto cybersicurezza, e una strategia di lancio estremamente prudente sono emerse da una fuga di documenti ospitati in una cache dati pubblica, poi chiusa.
La vicenda, avvenuta online e coinvolgente ricercatori di LayerX Security e dell’Università di Cambridge, mette in luce sia le ambizioni tecniche di Anthropic sia le criticità di sicurezza legate a modelli AI in grado di individuare e sfruttare vulnerabilità a una velocità superiore alle difese esistenti.
In sintesi:
- Anthropic testa il nuovo modello Claude Mythos/Capybara, descritto come il più potente mai sviluppato.
- Una configurazione errata del CMS ha esposto quasi 3.000 risorse interne, poi rimosse.
- Il modello introduce rischi di cybersicurezza senza precedenti, con capacità offensive superiori alle difese.
- Pianificati accesso anticipato a difensori cyber e un ritiro esclusivo per Ceo europei.
Secondo i documenti trapelati, Anthropic considera Claude Mythos un salto di qualità rispetto a Claude Opus 4.6, con risultati nettamente superiori nei test di programmazione, ragionamento accademico e sicurezza informatica.
Il nuovo livello di modello, identificato internamente come “Capybara”, si posizionerebbe sopra l’attuale fascia di punta Opus, più grande, più potente e più costoso dei modelli Sonnet e Haiku.
La fuga di informazioni è avvenuta tramite un data lake pubblico non protetto, dove erano presenti circa 3.000 asset legati al blog di Anthropic mai pubblicati ufficialmente, ma indicizzabili. Dopo la segnalazione da parte di Fortune, l’azienda ha chiuso l’accesso e parlato di “errore umano” nella configurazione del sistema di gestione dei contenuti.
Capybara, strategia di rilascio e nuovo perimetro di rischio cyber
La bozza di annuncio analizzata da Fortune descrive una strategia di rilascio cauta: il modello verrà inizialmente offerto in accesso anticipato a un ristretto numero di clienti aziendali e difensori informatici, data l’elevata potenza e i costi operativi.
Anthropic conferma di star sviluppando un modello “generalista” con avanzamenti significativi in ragionamento, programmazione e cybersicurezza, evidenziando la necessità di valutare con attenzione tempi e modalità di un rilascio pubblico.
L’azienda avverte che Capybara/Mythos è “molto più avanzato di qualsiasi altro modello di AI nelle capacità cyber” e anticipa un’imminente ondata di sistemi in grado di identificare e sfruttare vulnerabilità più velocemente delle contromisure. Per questo, il focus iniziale sarà fornire alle organizzazioni uno strumento per rafforzare i propri sistemi contro futuri exploit guidati dall’AI.
La fuga di dati ha anche rivelato un ritiro esclusivo nel Regno Unito per Ceo europei, guidato da Dario Amodei, con dimostrazioni di funzionalità Claude non ancora pubbliche, a conferma della strategia di posizionamento di Anthropic presso i vertici aziendali e regolatori.
Dal modello dual use agli scenari futuri per governi e imprese
L’emergere di modelli come Claude Mythos si inserisce in una corsa globale all’AI avanzata che ridefinisce il concetto di rischio informatico: strumenti progettati per aiutare i difensori possono, in assenza di controlli, amplificare la capacità offensiva di gruppi criminali e attori statali.
Anthropic ha già documentato tentativi di sfruttamento di Claude Code da parte di hacker legati al governo cinese contro circa 30 target, tra aziende tecnologiche, istituzioni finanziarie e agenzie governative.
Con l’arrivo di Capybara/Mythos, governi e grandi imprese europee dovranno accelerare l’adozione di framework di AI security, audit indipendenti e protocolli di divulgazione responsabile delle vulnerabilità, mentre i regolatori saranno chiamati a definire nuove soglie di rischio e requisiti di accesso per i modelli “ad alta capacità”.
FAQ
Che cos’è Claude Mythos, noto anche come Capybara, di Anthropic?
Claude Mythos, o Capybara, è un nuovo modello di AI generalista di Anthropic, più grande e potente di Claude Opus 4.6, con prestazioni superiori in programmazione, ragionamento e cybersicurezza.
Perché il nuovo modello di Anthropic è considerato rischioso per la cybersicurezza?
È considerato rischioso perché offre capacità cyber molto superiori ai modelli esistenti, potenzialmente in grado di trovare ed esploitare vulnerabilità più rapidamente dei difensori, abilitando attacchi su larga scala.
Cosa è successo nella fuga di dati che ha coinvolto Anthropic?
È avvenuta una configurazione errata di un sistema CMS esterno, che ha reso pubblici quasi 3.000 asset interni, inclusa la bozza dell’annuncio di Claude Mythos, poi rimossi dopo la segnalazione di Fortune.
Come verrà rilasciato inizialmente il modello Claude Mythos di Anthropic?
Verrà rilasciato in accesso anticipato a un gruppo ristretto di clienti e difensori cyber, con un approccio graduale, per valutare impatti, costi e rischi prima di qualsiasi disponibilità più ampia.
Quali sono le fonti utilizzate per questo articolo su Anthropic e Claude Mythos?
L’articolo deriva da una elaborazione congiunta delle fonti ufficiali Ansa.it, Adnkronos.it, Asca.it e Agi.it, opportunamente rielaborate dalla nostra Redazione.
DIRETTORE EDITORIALE
Michele Ficara Manganelli ✿
PUBBLICITA’ – COMUNICATI STAMPA – PROVE PRODOTTI
Per acquistare pubblicità CLICCA QUI
Per inviarci comunicati stampa e per proporci prodotti da testare prodotti CLICCA QUI



