Dunia kecerdasan buatan terus berkembang, dan sebuah terobosan baru dalam penelitian AI baru-baru ini telah membawa segalanya ke tingkat selanjutnya. Sebuah makalah baru memperkenalkan “Reflection,” agen otonom dengan memori dinamis dan kemampuan refleksi diri, yang memungkinkan model AI belajar dari kesalahan mereka sendiri dan meningkat seiring waktu. Perkembangan ini memberi model AI kemampuan penalaran seperti manusia dan menjanjikan peningkatan kinerja yang signifikan.

Apa itu Refleksi dan Mengapa Ini Signifikan?
Salah satu kelemahan terbesar dari model AI saat ini adalah ketidakmampuan mereka untuk belajar dari kesalahan. Refleksi mengatasi hal ini dengan memberi agen memori dinamis dan kemampuan refleksi diri, meningkatkan penalaran, jejak, dan kemampuan pilihan tindakan spesifik tugas yang sudah ada. Secara sederhana, model sekarang dapat mengingat tindakan yang telah diambilnya, meninjau tindakan tersebut, dan memperbaiki kesalahannya.
Hal hebat tentang pendekatan ini adalah bahwa pendekatan ini tidak terbatas pada model GPT-4; pendekatan ini dapat bekerja dengan model bahasa besar mana pun tanpa perlu penyetelan halus. Model refleksi hanya mengevaluasi fungsi reward dan memperbarui tindakan yang perlu diambil oleh model bahasa besar asli, memberikan peningkatan kinerja yang besar.
Makalah Refleksi Asli
Makalah refleksi asli menyajikan hasil pada dua dataset yang berbeda, menunjukkan kemampuannya untuk bernalar:
- Hotpot QA: Dataset untuk tanya jawab multi-hop yang beragam dan dapat dijelaskan, yang mengharuskan model bahasa untuk bernalar melalui berbagai dokumen.
- ELF World: Menyelaraskan teks dan lingkungan berwujud untuk pembelajaran interaktif, menggabungkan input dan output teks dengan dunia fisik, memungkinkan model untuk berinteraksi dengan dunia fisik menggunakan perintah teks.
Menambahkan refleksi ke model-model ini menghasilkan peningkatan kinerja yang signifikan, tanpa memerlukan penyetelan halus.
Menepis Kesalahpahaman Tentang Makalah Ini
Banyak orang keliru percaya bahwa makalah ini menggunakan GPT-4, tetapi sebenarnya menggunakan GPT-3 dan 3.5 (ChatGPT). Perbedaan ini signifikan karena membuka kemungkinan untuk menggabungkan refleksi dengan Auto GPT, memungkinkan model AI untuk memodifikasi tugas dengan cepat, memberikan kecerdasan sejati.
Refleksi dalam Aksi: Sebuah Contoh
Dalam tugas Hotpot QA, model perlu menemukan nama aktor yang paling dikenal karena peran dalam acara tertentu. Setelah percobaan awal yang tidak berhasil, model menggunakan refleksi untuk mengidentifikasi kesalahan dalam strategi pencariannya, memperbaikinya, dan akhirnya menemukan jawaban yang benar. Ini persis seperti bagaimana manusia akan mendekati suatu masalah, merefleksikan kesalahan mereka dan menyesuaikan strategi mereka sesuai dengan itu.
Keterbatasan dan Mengatasi Situasi Tanpa Kebenaran Dasar Definitif
Satu keterbatasan utama dari makalah ini adalah bahwa ia memerlukan kebenaran dasar untuk bekerja. Namun, dalam banyak situasi dunia nyata, tidak ada kebenaran dasar yang definitif atau solusi optimal tunggal. Para penulis makalah mengusulkan metode yang mencerminkan pemecahan masalah manusia, membuat rangkaian pengujian internal berdasarkan pemahaman mereka dan kemudian menyesuaikan solusi hingga memenuhi sebagian besar pengujian.
Dengan mengalihkan hambatan akurasi dari generasi kode sintaktik dan semantik yang benar ke generasi pengujian sintaktik dan semantik yang benar, model dapat mencapai tingkat akurasi yang lebih tinggi.
Masa Depan AI dan Refleksi
Seiring model AI dengan kemampuan refleksi menjadi lebih luas, kita dapat berharap untuk melihat peningkatan signifikan dalam kode yang dihasilkan AI dan tugas-tugas kompleks lainnya. Dengan kemampuan untuk secara iteratif meningkatkan pekerjaan mereka sendiri, model AI akan menjadi lebih efisien dan efektif dalam memecahkan masalah dan menghasilkan solusi.
Penting bagi kita sebagai manusia untuk merefleksikan perkembangan yang kita buat dalam AI dan mempertimbangkan arah yang ingin kita ambil. Terobosan dalam penalaran AI ini hanyalah permulaan, dan tidak diragukan lagi bahwa kemajuan yang lebih menarik menanti di masa depan.
Video oleh Prompt Engineering
Referensi:
- Makalah Refleksi: https://arxiv.org/pdf/2303.11366.pdf
- Blogpost Merefleksikan Refleksi: https://nanothoughts.substack.com/p/reflecting-on-reflexion
- Makalah HotpotQA: https://arxiv.org/pdf/1809.09600.pdf
- Makalah Alfworld: https://arxiv.org/pdf/2010.03768.pdf
- AutoGPT: https://github.com/Torantulino/Auto-GPT
- HumanEval: https://arxiv.org/pdf/2107.03374.pdf