GPT-4-mallit, jotka oppivat virheistään: Läpimurto tekoälyn päättelykyvyssä

Kategoria(t): AI/ML Avainsanat: , , , , ,
Save and Share:

Tekoälyn maailma kehittyy jatkuvasti, ja tuore tekoälytutkimuksen läpimurto on vienyt asiat uudelle tasolle. Uudessa julkaisussa esitellään ”Reflection” (heijastus), autonominen agentti, jolla on dynaaminen muisti ja itseheijastuskyky, mikä mahdollistaa tekoälymallien oppimisen omista virheistään ja kehittymisen ajan myötä. Tämä kehitys antaa tekoälymalleille ihmisenkaltaisia päättelykykyjä ja lupaa merkittävää suorituskyvyn parannusta.

Mikä on Reflection ja miksi se on merkittävä?

Yksi nykyisten tekoälymallien suurimmista heikkouksista on niiden kyvyttömyys oppia virheistään. Reflection korjaa tämän antamalla agentille dynaamisen muistin ja itseheijastuskyvyn, mikä parantaa niiden olemassa olevia päättely-, jäljitys- ja tehtäväkohtaisia toimintojen valintakykyjä. Yksinkertaisesti sanottuna malli voi nyt muistaa tekemänsä toimenpiteet, tarkastella niitä ja korjata virheensä.

Hienoa tässä lähestymistavassa on se, että se ei rajoitu GPT-4-malleihin; se toimii minkä tahansa suuren kielimallin kanssa ilman hienosäätöä. Reflection-malli yksinkertaisesti arvioi palkintofunktion ja päivittää alkuperäisen suuren kielimallin tarvitseman toiminnon, mikä parantaa suorituskykyä huomattavasti.

Alkuperäinen Reflection-julkaisu

Alkuperäinen Reflection-julkaisu esittelee tuloksia kahdella eri tietokokonaisuudella, mikä osoittaa sen päättelykykyä:

  1. Hotpot QA: Tietokokonaisuus monipuoliseen, selitettävään monivaiheiseen kysymys-vastausjärjestelmään, joka vaatii kielimallilta päättelyä useiden dokumenttien läpi.
  2. ELF World: Tekstin ja ruumiillistettujen ympäristöjen yhdistäminen interaktiiviseen oppimiseen, yhdistäen tekstisyötteet ja -tulosteet fyysiseen maailmaan, mikä mahdollistaa mallin vuorovaikutuksen fyysisen maailman kanssa tekstikehotteiden avulla.

Reflectionin lisääminen näihin malleihin johti merkittäviin suorituskyvyn parannuksiin ilman hienosäätöä.

Väärinkäsitysten hälventäminen julkaisusta

Monet uskovat virheellisesti, että julkaisu käyttää GPT-4:ää, mutta se käyttää itse asiassa GPT-3:a ja 3.5:tä (ChatGPT). Tämä ero on merkittävä, koska se avaa mahdollisuuden yhdistää reflection Auto GPT:hen, mikä mahdollistaa tekoälymallien muokkaavan tehtäviä lennossa ja tarjoavan todellista älykkyyttä.

Reflection käytännössä: Esimerkki

Hotpot QA -tehtävässä mallin piti löytää näyttelijän nimi, joka tunnetaan parhaiten roolista tietyssä sarjassa. Epäonnistuneen ensimmäisen yrityksen jälkeen malli käytti reflectionia tunnistaakseen virheen hakustrategiassaan, korjatakseen sen ja löytääkseen lopulta oikean vastauksen. Juuri näin ihminen lähestyisi ongelmaa, pohtien virheitään ja muokaten strategiaansa sen mukaisesti.

Rajoitukset ja tilanteiden käsitteleminen ilman lopullista totuutta

Yksi julkaisun suurimmista rajoituksista on se, että se vaatii toimiakseen pohjatotuuden. Monissa tosielämän tilanteissa ei kuitenkaan ole olemassa lopullista pohjatotuutta tai yhtä optimaalista ratkaisua. Julkaisun kirjoittajat ehdottavat menetelmää, joka jäljittelee ihmisen ongelmanratkaisua, luoden sisäisen testisarjan ymmärryksensä perusteella ja säätäen sitten ratkaisuja, kunnes ne täyttävät suurimman osan testeistä.

Siirtämällä tarkkuuden pullonkaulan oikeasta syntaktisesta ja semanttisesta koodin generoinnista oikeaan syntaktiseen ja semanttiseen testin generointiin, malli voi saavuttaa korkeammat tarkkuusasteet.

Tekoälyn ja Reflectionin tulevaisuus

Kun reflection-kyvyillä varustetut tekoälymallit yleistyvät, voimme odottaa näkevämme merkittäviä parannuksia tekoälyn tuottamassa koodissa ja muissa monimutkaisissa tehtävissä. Kykynsä ansiosta parantaa omaa työtään iteratiivisesti, tekoälymalleista tulee tehokkaampia ja tuloksellisempia ongelmien ratkaisemisessa ja ratkaisujen luomisessa.

Meidän ihmisten on olennaista pohtia tekoälyn alalla tekemäämme kehitystä ja miettiä, mihin suuntaan haluamme sitä viedä. Tämä läpimurto tekoälyn päättelykyvyssä on vasta alkua, eikä ole epäilystäkään siitä, että edessä on vielä jännittävämpiä edistysaskeleita.

Video: Prompt Engineering

Viitteet:

Kirjoita kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *