Anthropic ridisegna le regole del chatbot e restringe l’accesso ai contenuti delicati, tra etica, sicurezza, controllo

Anthropic aggiorna le regole del suo chatbot, nuovi limiti a temi sensibili

Nuove regole per l’IA

Anthropic ha aggiornato il quadro etico che governa il suo chatbot Claude, definendo una serie di paletti operativi pensati per ridurre il rischio di risposte inappropriate o dannose. Il documento, pubblicato online con il titolo “la nuova costituzione di Claude”, sostituisce la versione del 2023, recependo il dibattito internazionale sulla sicurezza dell’Intelligenza artificiale.

Le nuove norme mirano a contenere le aree di rischio, intervenendo in particolare su temi che possono generare conseguenze concrete nel mondo reale, dalla salute alle sostanze chimiche pericolose. L’obiettivo dichiarato è allineare il comportamento del sistema a principi di responsabilità, protezione degli utenti più vulnerabili e riduzione dell’impatto sociale negativo.

In questo quadro, l’azienda statunitense conferma un approccio “costituzionale” allo sviluppo dei modelli, cioè un insieme di regole esplicite che guidano il chatbot nella selezione e nella forma delle risposte, con controlli aggiuntivi su scenari ad alto rischio.

Limiti su politica, salute e minori

Le nuove linee guida rafforzano i divieti in materia di politica, salute e interazioni con i minori. Il sistema non deve esprimere opinioni personali su questioni politiche divisive come l’aborto, né produrre contenuti che possano risultare discriminatori o incitare all’odio. L’intento è ridurre la possibilità di influenzare il dibattito pubblico o polarizzare ulteriormente il confronto.

🔥 DA NON PERDERE ▷ Banche europee: l’AI minaccia migliaia di posti, rivoluzione del lavoro e tagli senza precedenti

Sul fronte sanitario, le risposte devono evitare qualsiasi suggerimento che possa sostituire il parere di un medico, in particolare quando si toccano ambiti come diagnosi, terapie o gestione di emergenze. È prevista un’attenzione specifica alle conversazioni su autolesionismo e suicidio, con l’obbligo di seguire protocolli prudenziali e di orientare l’utente verso canali di aiuto qualificati.

Per i minori, il chatbot deve adottare criteri ancora più restrittivi, limitando l’accesso a contenuti sensibili e gestendo le richieste con un livello di cautela maggiore, anche quando le domande non sembrano immediatamente rischiose.

Il confronto con gli altri big dell’AI

L’iniziativa di Anthropic si inserisce in un movimento più ampio del settore. A dicembre OpenAI ha aggiornato il proprio documento di riferimento, il “model spec” di ChatGPT, introducendo nuovi indicatori sul comportamento del chatbot con i minori e sulla gestione di contenuti delicati come il suicidio. Entrambi gli aggiornamenti mostrano la convergenza dei big dell’AI su standard di sicurezza più stringenti.

🔥 DA NON PERDERE ▷ Nuovo Programma di Accelerazione AI Europeo finanziato da Meta

La nuova cornice etica di Claude insiste sul ricorso al “buon senso” del sistema nel valutare le intenzioni dell’utente, imponendo tuttavia limiti chiari: niente istruzioni per la sintesi di sostanze chimiche pericolose, né supporto alla creazione di armi biologiche o ad altre attività potenzialmente criminali. Il chatbot deve riconoscere e disinnescare richieste dannose, offrendo alternative sicure.

La pubblicazione del documento è avvenuta in concomitanza con la partecipazione del CEO Dario Amodei al World Economic Forum di Davos, segnale della volontà dell’azienda di giocare un ruolo centrale nei negoziati globali su regolazione, governance e responsabilità dell’Intelligenza artificiale.

FAQ

D: Che cos’è la “costituzione” di Claude?
R: È un insieme di regole etiche e operative che guidano il comportamento del chatbot di Anthropic.

D: Quali argomenti vengono limitati maggiormente?
R: In particolare temi politici divisivi, salute, conversazioni con minori, autolesionismo e suicidio.

🔥 DA NON PERDERE ▷ Responsabile per la gestione dei rischi dell'IA: opportunità e sfide per OpenAI e il settore tecnologico

D: Perché l’IA non può esprimere opinioni politiche personali?
R: Per evitare di influenzare il dibattito pubblico e ridurre il rischio di polarizzazione o propaganda.

D: Come vengono trattati i temi di autolesionismo e suicidio?
R: Il sistema deve seguire linee guida specifiche, rispondere con estrema cautela e indirizzare verso aiuti professionali.

D: Cosa è vietato sul fronte scientifico e chimico?
R: Non sono consentite istruzioni per sintetizzare sostanze chimiche pericolose o sviluppare armi biologiche.

D: Cosa ha fatto OpenAI in questo ambito?
R: Ha aggiornato il documento model spec di ChatGPT, introducendo nuove regole per minori e contenuti sensibili.

D: Qual è il ruolo di Dario Amodei in questo annuncio?
R: Il CEO di Anthropic ha presentato il nuovo impianto di regole anche in occasione del World Economic Forum di Davos.

D: Qual è la fonte giornalistica originale citata?
R: Le informazioni derivano da una notizia dell’agenzia ANSA relativa all’aggiornamento delle regole del chatbot di Anthropic.

Redazione Assodigitale

La Redazione di Assodigitale Phd, MBA, CPA

Il team editoriale di Assodigitale coordina la pubblicazione di notizie, analisi e approfondimenti quotidiani dal mondo dell'innovazione, della tecnologia e dei mercati digitali.

Questo account raccoglie i contributi storici della testata, i comunicati stampa certificati e le inchieste collettive curate dai nostri giornalisti e analisti.

Fondata per esplorare l'impatto della trasformazione digitale sulla società e sull'economia, la Redazione di Assodigitale si impegna a fornire un'informazione accurata, indipendente e verificata, seguendo rigorosi standard deontologici e di fact-checking per garantire ai lettori una visione chiara ed esperta del futuro tecnologico."

Per tutte le vostre esigenze editoriali e per proporci progetti speciali di Branded Content oppure per inviare alla redazione prodotti per recensioni e prove tecniche potete contattarci direttamente scrivendo alla redazione : CLICCA QUI

Areas of Expertise: Digital Marketing, SEO, Content Strategy, Crypto, Blockchain, Fintech, Finance, Web3, Metaverse, Digital Content, Journalism, Branded Content, Digital Transformation, AI Strategy, Digital Publishing, DeFi, Tokenomics, Growth Hacking, Online Reputation Management, Emerging Tech Trends, Business Development, Media Relations, Editorial Management.