Modelli GPT-4 che imparano dai propri errori: una svolta nel ragionamento dell’IA

Categorie: AI/ML Taggato , , , , ,
Save and Share:

Il mondo dell’intelligenza artificiale è in continua evoluzione e una recente svolta nella ricerca sull’IA ha portato le cose a un livello superiore. Un nuovo articolo introduce “Reflection”, un agente autonomo dotato di memoria dinamica e capacità di autoriflessione, che consente ai modelli di IA di imparare dai propri errori e migliorare nel tempo. Questo sviluppo conferisce ai modelli di IA capacità di ragionamento simili a quelle umane e promette un notevole incremento delle prestazioni.

Cos’è Reflection e perché è significativo?

Una delle maggiori debolezze degli attuali modelli di IA è la loro incapacità di imparare dai propri errori. Reflection affronta questo problema dotando un agente di memoria dinamica e capacità di autoriflessione, migliorando le loro capacità esistenti di ragionamento, tracciamento e scelta di azioni specifiche per attività. In parole semplici, il modello ora può memorizzare le azioni intraprese, rivedere tali azioni e correggere i propri errori.

L’aspetto positivo di questo approccio è che non è limitato ai modelli GPT-4; può funzionare con qualsiasi modello linguistico di grandi dimensioni senza necessità di messa a punto. Il modello di reflection valuta semplicemente la funzione di ricompensa e aggiorna l’azione che deve essere intrapresa dal modello linguistico di grandi dimensioni originale, offrendo un enorme incremento delle prestazioni.

L’articolo originale su Reflection

L’articolo originale su reflection presenta i risultati su due diversi set di dati, dimostrando la sua capacità di ragionamento:

  1. Hotpot QA: un set di dati per domande e risposte multihop diversificate e spiegabili, che richiede al modello linguistico di ragionare attraverso più documenti.
  2. ELF World: allineamento di testo e ambienti embodied per l’apprendimento interattivo, combinando input e output di testo con il mondo fisico, consentendo al modello di interagire con il mondo fisico utilizzando prompt testuali.

L’aggiunta di reflection a questi modelli ha portato a significativi miglioramenti delle prestazioni, senza necessità di messa a punto.

Sfatiamo i preconcetti sull’articolo

Molti credono erroneamente che l’articolo utilizzi GPT-4, ma in realtà utilizza GPT-3 e 3.5 (ChatGPT). Questa distinzione è significativa perché apre la possibilità di combinare reflection con Auto GPT, consentendo ai modelli di IA di modificare le attività al volo, fornendo vera intelligenza.

Reflection in azione: un esempio

In un’attività di Hotpot QA, il modello doveva trovare il nome di un attore famoso per un ruolo in una specifica serie TV. Dopo un tentativo iniziale fallito, il modello ha utilizzato la reflection per identificare l’errore nella sua strategia di ricerca, correggerlo e infine trovare la risposta corretta. Questo è esattamente il modo in cui un essere umano affrontarebbe un problema, riflettendo sui propri errori e adeguando di conseguenza la propria strategia.

Limitazioni e gestione di situazioni senza una verità di fondo definitiva

Una delle principali limitazioni dell’articolo è che richiede una verità di fondo per funzionare. Tuttavia, in molte situazioni reali, non esiste una verità di fondo definitiva o un’unica soluzione ottimale. Gli autori dell’articolo propongono un metodo che rispecchia la risoluzione di problemi umana, creando una suite di test interni basata sulla loro comprensione e quindi modificando le soluzioni finché non soddisfano la maggior parte dei test.

Spostando il collo di bottiglia dell’accuratezza dalla corretta generazione di codice sintattico e semantico alla corretta generazione di test sintattici e semantici, il modello può raggiungere tassi di accuratezza più elevati.

Il futuro dell’IA e della Reflection

Man mano che i modelli di IA con capacità di reflection si diffonderanno, possiamo aspettarci di vedere miglioramenti significativi nel codice generato dall’IA e in altre attività complesse. Con la capacità di migliorare iterativamente il proprio lavoro, i modelli di IA diventeranno più efficienti ed efficaci nel risolvere problemi e generare soluzioni.

È essenziale per noi umani riflettere sugli sviluppi che stiamo compiendo nell’IA e considerare la direzione che vogliamo intraprendere. Questa svolta nel ragionamento dell’IA è solo l’inizio e non c’è dubbio che ci aspettino progressi ancora più entusiasmanti.

Video di Prompt Engineering

Riferimenti:

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *