Orca LLM: Açık Kaynak LLM’ler Okyanusunun Yeni Kralı

Açık Kaynak, AI/ML olarak sınıflandırılmış , , , , ile etiketlenmiş
Save and Share:

Microsoft Research, GPT-4’ün Karmaşık Açıklama İzlerinden Aşamalı Öğrenme konusundaki çabaları ve başarıları hakkında çok umut verici bir makale yayınladı. İşin en heyecan verici kısmı ise yakında yayınlayacak olmaları ve şu anda LLaMA’nın yayın politikasına uygun olarak model ağırlıklarının bir farkını (diff) kamuya açık bir şekilde yayınlamak için hukuk ekipleriyle birlikte çalışıyor olmaları.

Orca LLM nedir ve neden bu kadar önemli?

Son zamanlardaki araştırmalar, daha küçük modelleri daha büyük modeller tarafından üretilen bilgileri kullanarak öğreterek daha güçlü hale getirmeye odaklanıyor. Bu süreçte çeşitli zorluklar bulunmaktadır:

  1. Sınırlı taklit sinyalleri: Daha büyük modeller yalnızca kısmi çıktılar sağladığından, daha küçük modellerin öğrenebileceği bilgi sınırlıdır.
  2. Küçük ölçekli homojen eğitim verisi: Daha küçük modeller için eğitim verileri genellikle küçüktür ve birbirine benzerdir, bu da öğrenme potansiyellerini sınırlar.
  3. Titiz değerlendirme eksikliği: Daha küçük modeller, daha büyük modellerin stilini taklit etme eğilimindedir, ancak akıl yürütme yeteneklerini tekrarlamakta zorlanırlar. Bunun nedeni, daha küçük modellerin kapsamlı bir şekilde değerlendirilmemesi ve bu da yeteneklerinin abartılmasına yol açmasıdır.

Bu zorlukların üstesinden gelmek için araştırmacılar Orca adlı yeni bir model geliştirdiler.

Orca LLM, 13 milyar parametreye sahip bir modeldir ve daha büyük modellerin akıl yürütme sürecini öğrenmek üzere tasarlanmıştır. GPT-4 tarafından sağlanan, her adımın açıklamaları, ayrıntılı düşünce süreçleri ve karmaşık talimatlar dahil olmak üzere zengin bilgilerden öğrenir. Ek olarak, öğrenme sürecine yardımcı olmak için ChatGPT’den rehberlik alır.

Öğrenmeyi daha etkili hale getirmek için Orca LLM, çeşitli ve kapsamlı bir taklit verisi yelpazesi kullanır. Modelin çok çeşitli örneklerden öğrenmesini sağlamak için dikkatli örnekleme ve seçim teknikleri kullanılır. Sonuçlar etkileyici oldu:

  • Orca LLM, Big-Bench Hard (BBH) gibi zorlu akıl yürütme görevlerinde Vicuna-13B gibi talimatları izlemek için özel olarak ayarlanmış diğer son teknoloji modellerinden %100’den fazla ve AGIEval’de %42 daha iyi performans gösteriyor.
  • Dahası, Orca LLM, BBH kıyaslamasında ChatGPT ile benzer bir seviyede performans gösteriyor ve SAT, LSAT, GRE ve GMAT gibi profesyonel ve akademik sınavlarda rekabetçi bir performans sergiliyor (optimize edilmiş bir sistem mesajına kıyasla sadece 4 puanlık bir farkla). Bu, belirli sorulara veya görevlere önceden maruz kalmadan, sıfır atışlı bir ortamda elde ediliyor.
  • Ancak Orca LLM, performans açısından hala GPT-4’ün biraz gerisinde kalıyor.

Genel olarak, bu araştırma, ister insanlardan ister daha gelişmiş yapay zeka modellerinden gelsin, adım adım açıklamalardan öğrenmenin, Orca gibi modellerin yeteneklerini ve becerilerini geliştirmek için umut verici bir yön olduğunu gösteriyor.

Orca LLM Araştırma Makalesinin Video İncelemeleri

“AI Explained” tarafından Orca LLM hakkında Youtube Videosu
Matthew Berman tarafından Orca LLM hakkında Youtube Videosu

Yorum Gönderin

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir