GPT-5 Pro heeft onlangs twee verschillende en notoir moeilijke wiskundige problemen opgelost en daarmee een krachtig nieuw niveau van abstract redeneren gedemonstreerd. Dit zijn niet zomaar slimme trucs; één oplossing is een uitdaging op het niveau van de Internationale Wiskunde Olympiade (IMO), terwijl de andere een lang gekoesterde aanname in de informatietheorie weerlegt.
Het is vermeldenswaard dat zijn grootste concurrenten, zoals Google’s Gemini 2.5 Pro in de 'Deep Think'-modus en Anthropic’s Claude 4.5+, nog niet publiekelijk zijn getest op deze specifieke problemen.
Hier volgt een eenvoudige uiteenzetting van wat er is gebeurd.
1. De algebrapuzzel: Het 554e probleem van Yu Tsumura
Wat is het? Dit is een probleem uit een verzameling van Yu Tsumura, met een moeilijkheidsgraad die vergelijkbaar is met die van de Internationale Wiskunde Olympiade (IMO). De opgave is om te bewijzen dat een specifieke wiskundige groep, gedefinieerd door de regels die haar twee generatoren beheersen, 'triviaal' is (wat betekent dat het de eenvoudigst mogelijke groep is). Vanwege de beknopte formulering is het een benchmark geworden om te testen of een AI een hoog niveau van wiskundig redeneervermogen heeft bereikt.
Wat heeft GPT-5 Pro gedaan? Het was het eerste AI-model dat het probleem oploste. Volgens onafhankelijke wiskundigen die het model hebben getest, leverde GPT-5 Pro in slechts 15 minuten een volledig bewijs, zonder enige internettoegang.
Waarom is dit belangrijk? Dit is een directe maatstaf voor vooruitgang. Slechts een paar maanden geleden stelde een onderzoeksartikel met de titel "No LLM Solved Yu Tsumura’s 554th Problem" dat de huidige modellen niet in staat waren tot dergelijke taken. Het succes van GPT-5 Pro toont de ongelooflijk snelle vooruitgang in de redeneervaardigheden van AI aan.
2. De doorbraak in de informatietheorie: Weerlegging van de optimaliteit van de meerderheidsfunctie
Wat is het? Dit probleem, bekend als 'NICD-with-erasures majority optimality', komt uit de informatietheorie. Stel je voor dat twee mensen beschadigde versies van hetzelfde signaal ontvangen. Ze proberen elk een functie te raden op basis van hun gedeeltelijke data, met als doel de kans te maximaliseren dat ze beiden hetzelfde raden. Lange tijd geloofden experts dat de beste strategie de 'meerderheidsfunctie' was (in wezen een democratische stemming onder de datapunten).
Wat heeft GPT-5 Pro gedaan? Het weerlegde deze lang gekoesterde overtuiging. In plaats van de beste functie te vinden, vond GPT-5 Pro een specifiek tegenvoorbeeld: een andere functie die onder bepaalde omstandigheden iets, maar wel definitief, beter presteert dan de meerderheidsregel.
Hier is het tegenvoorbeeld dat het vond voor een specifieke opstelling (p=0.4, n=5):
f(x) = sign(x_1 - 3x_2 + x_3 - x_4 + 3x_5)
Deze functie behaalde een score van 0.43024 en versloeg daarmee de score van de beste meerderheidsfunctie van 0.42904.
Waarom is dit belangrijk? Dit is een fundamenteel probleem met enorme praktische toepassingen. Het vinden van optimale functies voor signaalherstel heeft een directe invloed op hoe we foutcorrigerende codes ontwerpen voor dataopslag, communicatiekanalen en dataherstel. Door de oude aanname te weerleggen, heeft GPT-5 Pro een nieuw hoofdstuk voor onderzoek in dit veld geopend.





