• ADV
    • CHI SIAMO
    • CONTATTI
  • TECH
  • FINTECH
  • AI
  • WEB3
  • LIFESTYLE
  • MOTORI
  • SVIZZERA
  • SVAPO
  • BRANDED
  • TREND
  • PUBBLICITA’
  • CHI SIAMO
  • REDAZIONE
  • CONTATTI
  • CISION – PRNEWSWIRE
#ASSODIGITALE.

NEWS TECH & FINTECH + AI & LIFESTYLE

#ASSODIGITALE.
  • ADV
    • CHI SIAMO
    • CONTATTI
  • TECH
  • FINTECH
  • AI
  • WEB3
  • LIFESTYLE
  • MOTORI
  • SVIZZERA
  • SVAPO
  • BRANDED
  • TREND
  • AI INTELLIGENZA ARTIFICIALE

Super Mario rivoluziona l’intelligenza artificiale con un nuovo incredibile benchmark

  • Redazione Assodigitale
  • 4 Marzo 2025
Super Mario rivoluziona l'intelligenza artificiale con un nuovo incredibile benchmark

### Super Mario come benchmark per l’intelligenza artificiale

▷ GUADAGNA & RISPARMIA con i nostri Coupon & Referral Code: CLICCA QUI ORA!

Il recente utilizzo di Super Mario Bros. come strumento di valutazione per l’intelligenza artificiale rappresenta un innovativo approccio nel campo della ricerca. Nonostante il gioco risalga al 1985, ha rivelato le complessità delle prestazioni degli algoritmi AI moderni. Il progetto dell’Hao AI Lab, collegato all’Università della California a San Diego, ha messo in luce come i modelli AI, come Claude 3.7 di Anthropic e GPT-4o di OpenAI, affrontino le sfide in modo significativo mentre controllano Mario in un contesto di gioco emulato. Questa scelta non è casuale: il gioco fornisce condizioni di test che richiedono pianificazioni strategiche e adattamenti in tempo reale, qualità che sono essenziali per la misurazione delle capacità decisionali delle AI.

Indice dei Contenuti:
  • Super Mario rivoluziona l’intelligenza artificiale con un nuovo incredibile benchmark
  • ### Super Mario come benchmark per l’intelligenza artificiale
  • ### Le AI in gara: una sfida emulata
  • ### La crisi di identità dei benchmark attuali

### Le AI in gara: una sfida emulata

PARTECIPA ALLA BWR 2025 CON IL CODICE SCONTO DEL 10%
ISCRIVITI ORA USANDO IL CODICE – SWISSBLOCKCHAIN10 – PER AVERE LO SCONTO DEL 10% SUL BIGLIETTO DI INGRESSO! ==>
CLICCA QUI!

LEGGI ANCHE ▷  Intelligenza artificiale e Liliana Segre: combattere odio e razzismo insieme

Nel contesto di questa sfida, l’Hao AI Lab ha implementato un framework chiamato GamingAgent, progettato specificamente per controllare Mario attraverso interazioni dinamiche nel gioco. Le AI partecipanti, tra cui Claude 3.7, Claude 3.5, Gemini 1.5 Pro e GPT-4o, sono state equipaggiate con linee guida fondamentali come “Se un ostacolo o un nemico è vicino, muoviti o salta a sinistra”. Questo approccio ha consentito alle AI di ricevere feedback in tempo reale sotto forma di screenshot, rendendo la competizione ancora più avvincente e impegnativa. La generazione di input, realizzata tramite codice Python, ha rappresentato una sfida tecnica significativa, costringendo i modelli a interagire con il gioco in modo fluido e reattivo.

Una delle scoperte più curiose del test è stata la performance dei modelli basati su ragionamento, come o1 di OpenAI, i quali hanno mostrato performance inferiori rispetto ai modelli standard. Nonostante la loro superiorità in diversi benchmark classici, in un ambiente frenetico come quello di Super Mario, il tempo di elaborazione si è rivelato un fattore cruciale per il successo nel gioco. Questo dimostra che, sebbene le capacità analitiche siano fondamentali, la rapidità di reazione e l’adattamento strategico risultano essenziali per superare gli ostacoli e i nemici nel tempo limitato che il gioco impone.

LEGGI ANCHE ▷  Come migliorare la qualità delle immagini generate dall'IA

### La crisi di identità dei benchmark attuali


SCONTO 10% sul PREZZO DEL ticket usando il codice MEDIA10 ==> CLICCA QUI

La discussione sull’affidabilità degli attuali benchmark per l’intelligenza artificiale è sempre più rilevante all’interno della comunità scientifica. Expert come Andrej Karpathy di OpenAI hanno sollevato interrogativi fondamentali sulla capacità di misurare efficacemente le prestazioni dei modelli AI. Karpathy ha evidenziato che le metriche tradizionali, come il MMLU, che erano utili in passato, hanno mostrato i loro limiti, lasciando gli esperti in una situazione di crisi valutativa. Questa considerazione invita a riflettere sulla necessità di metodi di valutazione più robusti e realistici, che possano rispecchiare le sfide pratiche dell’AI.

In questo contesto, l’uso dei videogiochi come Super Mario offre spunti interessanti, ma anche complessità sconosciute. I risultati dei test mostrano che, sebbene alcuni modelli possano performare bene in ambienti controllati, il passaggio a scenari complessi e imprevedibili come un videogioco attivo può rivelare debolezze significative. La rapidità e l’efficacia delle decisioni devono essere valutate in relazione al tempo reale richiesto per completare le azioni nel gioco, un aspetto che spesso viene trascurato nei benchmark più tradizionali.

LEGGI ANCHE ▷  Racconti di ispirazione per trasformare la tua vita quotidiana con creatività

La sfida, quindi, è quella di sviluppare strumenti di valutazione che non solo testino le capacità analitiche e strategiche delle AI, ma che incorporino anche elementi di reattività e capacità di adattamento alle condizioni dinamiche, caratteristiche sempre più necessarie per un’accurata valutazione delle prestazioni dei sistemi intelligenti.


Sostieni Assodigitale.it nella sua opera di divulgazione

Grazie per avere selezionato e letto questo articolo che ti offriamo per sempre gratuitamente, senza invasivi banner pubblicitari o imbarazzanti paywall e se ritieni che questo articolo per te abbia rappresentato un arricchimento personale e culturale puoi finanziare il nostro lavoro con un piccolo sostegno di 1 chf semplicemente CLICCANDO QUI.

← Post Precedente
Post Successivo →
Redazione Assodigitale

Articolo editoriale realizzato dalla Redazione di Assodigitale. Per tutte le vostre esigenze editoriali e per proporci progetti speciali di Branded Content oppure per inviare alla redazione prodotti per recensioni e prove tecniche potete contattarci direttamente scrivendo alla redazione : CLICCA QUI

 


ISCRIVITI SUBITO AL NOSTRO FEED SU GOOGLE NEWS ==> CLICCA QUI!


DIRETTORE EDITORIALE

Michele Ficara Manganelli ✿

PUBBLICITA’ – COMUNICATI STAMPA – PROVE PRODOTTI

Per acquistare pubblicità CLICCA QUI

Per inviarci comunicati stampa e per proporci prodotti da testare prodotti CLICCA QUI

#ASSODIGITALE.
  • PUBBLICITA’
  • JOBS
  • REDAZIONE
  • CHI SIAMO
  • CONTATTI – IMPRESSUM
  • PRIVACY
  • COOKIE

PUBBLICITA’ COMUNICATI STAMPA

Per acquistare pubblicità potete richiedere una offerta personalizzata scrivendo al reparto pubblicitario.

Per pubblicare un comunicato stampa potete richiedere una offerta commerciale scrivendo alla redazione.

Per inviarci prodotti per una recensione giornalistica potete scrivere QUI

Per informazioni & contatti generali potete scrivere alla segreteria.

Tutti i contenuti pubblicati all’interno del sito #ASSODIGITALE. “Copyright 2024” non sono duplicabili e/o riproducibili in nessuna forma, ma possono essere citati inserendo un link diretto e previa comunicazione via mail.

FONTE UFFICIALE GOOGLE NEWS

#ASSODIGITALE. da oltre 20 anni rappresenta una affidabile fonte giornalistica accreditata e certificata da Google News per la qualità dei suoi contenuti.

#ASSODIGITALE. è una testata editoriale storica che dal 2004 ha la missione di raccontare come la tecnologia può essere utile per migliorare la vita quotidiana approfondendo le tematiche relative a: TECH & FINTECH + AI + CRYPTO + BLOCKCHAIN + METAVERSE & LIFESTYLE + IOT + AUTOMOTIVE + EV + SMART CITIES + GAMING + STARTUP.

 

Inserisci la chiave di ricerca e premi invio.