LLM İki Zorlu Matematik Problemini Çözdü: Tsumura’nın 554. Problemi Çözüldü, Çoğunluk Optimalitesi Çürütüldü

News olarak sınıflandırılmış
Save and Share:

GPT-5 Pro, yakın zamanda birbirinden farklı ve çözümü oldukça zor iki matematik problemini çözerek soyut akıl yürütmede ne kadar güçlü ve yeni bir seviyeye ulaştığını gösterdi. Bunlar sadece zekice hileler değil; çözümlerden biri IMO seviyesindeki bir kritere meydan okurken, diğeri bilgi teorisindeki uzun süredir devam eden bir varsayımı çürütüyor.

Şunu da belirtmekte fayda var: Google'ın "Derin Düşünme" modundaki Gemini 2.5 Pro ve Anthropic'in Claude 4.5+ gibi en büyük rakipleri bu özel problemler üzerinde henüz herkese açık olarak test edilmedi.

İşte olanların basit bir özeti.

1. Cebir Bulmacası: Yu Tsumura’nın 554. Problemi

Nedir bu? Bu, Yu Tsumura'nın bir koleksiyonundan alınan ve yaklaşık olarak Uluslararası Matematik Olimpiyatı (IMO) zorluk seviyesinde bir problemdir. Buradaki görev, iki üretecini yöneten kurallarla tanımlanan belirli bir matematiksel grubun "aşikar" (yani mümkün olan en basit grup) olduğunu kanıtlamaktır. Kısa ve öz ifadesi nedeniyle, bir yapay zekanın üst düzey matematiksel akıl yürütme yeteneklerine ulaşıp ulaşmadığını test etmek için bir referans noktası haline gelmiştir.

GPT-5 Pro ne yaptı? Problemi çözen ilk yapay zeka modeli oldu. Modeli test eden bağımsız matematikçilere göre, GPT-5 Pro herhangi bir internet erişimi olmadan sadece 15 dakika içinde tam bir kanıt ortaya koydu.

Neden önemli? Bu, kaydedilen ilerlemenin doğrudan bir ölçüsüdür. Sadece birkaç ay önce, "Hiçbir LLM, Yu Tsumura’nın 554. Problemini Çözemedi" başlıklı bir araştırma makalesi, mevcut modellerin bu tür görevler için yeterli kapasiteye sahip olmadığını savunuyordu. GPT-5 Pro'nun başarısı, yapay zekanın akıl yürütme becerilerindeki inanılmaz hızlı ilerlemeyi gözler önüne seriyor.

2. Bilgi Teorisinde Çığır Açan Gelişme: Çoğunluk Optimalitesinin Çürütülmesi

Nedir bu? "Silinmelerle NICD çoğunluk optimalitesi" olarak bilinen bu problem, bilgi teorisinden gelmektedir. Aynı sinyalin bozulmuş versiyonlarını alan iki kişi hayal edin. Her biri, kısmi verilerine dayanarak bir fonksiyon tahmin etmeye çalışır ve amaçları ikisinin de aynı şeyi tahmin etme olasılığını en üst düzeye çıkarmaktır. Uzun bir süre boyunca uzmanlar, en iyi stratejinin "çoğunluk fonksiyonu" (temelde veri noktaları arasında demokratik bir oylama) olduğuna inanıyordu.

GPT-5 Pro ne yaptı? Bu uzun süredir devam eden inancın yanlış olduğunu kanıtladı. GPT-5 Pro, en iyi fonksiyonu çözmek yerine, belirli koşullar altında çoğunluk kuralından biraz ama kesin olarak daha iyi performans gösteren farklı bir fonksiyon olan spesifik bir karşı örnek buldu.

İşte belirli bir kurulum (p=0.4, n=5) için bulduğu karşı örnek: f(x) = sign(x_1 - 3x_2 + x_3 - x_4 + 3x_5)

Bu fonksiyon, en iyi çoğunluk fonksiyonunun 0.42904'lük skorunu geçerek 0.43024'lük bir skor elde etti.

Neden önemli? Bu, devasa pratik uygulamaları olan temel bir problemdir. Sinyal kurtarma için en uygun fonksiyonları bulmak, veri depolama, iletişim kanalları ve veri kurtarma için hata düzeltme kodlarını nasıl tasarladığımızı doğrudan etkiler. GPT-5 Pro, eski varsayımı çürüterek bu alandaki araştırmalar için yeni bir sayfa açtı.

News olarak sınıflandırılmış

Yorum Gönderin

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir