GPT-5 Pro ha recentemente risolto due problemi matematici distinti e notoriamente difficili, dimostrando un nuovo e potente livello di ragionamento astratto. Non si tratta di semplici trucchi ingegnosi; una soluzione mette in discussione un benchmark di livello IMO, mentre l'altra confuta un'ipotesi di lunga data nella teoria dell'informazione.
È importante notare che i suoi principali concorrenti, come Gemini 2.5 Pro di Google in modalità "Deep Think" e Claude 4.5+ di Anthropic, non sono ancora stati testati pubblicamente su questi specifici problemi.
Ecco una semplice spiegazione di ciò che è accaduto.
1. L'enigma di algebra: il 554° problema di Yu Tsumura
Di cosa si tratta? È un problema tratto da una raccolta di Yu Tsumura, con un livello di difficoltà paragonabile a quello delle Olimpiadi Internazionali della Matematica (IMO). Il compito è dimostrare che un gruppo matematico specifico, definito dalle regole che governano i suoi due generatori, è "banale" (ovvero, è il gruppo più semplice possibile). Grazie alla sua formulazione concisa, è diventato un punto di riferimento per testare se un'IA ha raggiunto capacità di ragionamento matematico di alto livello.
Cosa ha fatto GPT-5 Pro? È diventato il primo modello di IA a risolvere il problema. Secondo matematici indipendenti che hanno testato il modello, GPT-5 Pro ha prodotto una dimostrazione completa in soli 15 minuti, senza alcun accesso a Internet.
Perché è importante: Questa è una misura diretta del progresso. Solo un paio di mesi fa, un articolo di ricerca intitolato "Nessun LLM ha risolto il 554° problema di Yu Tsumura" sosteneva che i modelli attuali non avessero le capacità per compiti del genere. Il successo di GPT-5 Pro dimostra il ritmo incredibilmente rapido dei progressi nelle capacità di ragionamento dell'IA.
2. La svolta nella teoria dell'informazione: la confutazione dell'ottimalità della maggioranza
Di cosa si tratta? Questo problema, noto come "ottimalità della maggioranza per NICD con cancellazioni", deriva dalla teoria dell'informazione. Immaginate che due persone ricevano versioni corrotte dello stesso segnale. Ognuna cerca di indovinare una funzione basandosi sui propri dati parziali, con l'obiettivo di massimizzare le probabilità che entrambe indovinino la stessa cosa. Per molto tempo, gli esperti hanno creduto che la strategia migliore fosse la "funzione di maggioranza" (in sostanza, un voto democratico tra i punti dati).
Cosa ha fatto GPT-5 Pro? Ha dimostrato che questa convinzione di lunga data era sbagliata. Anziché risolvere per la funzione migliore, GPT-5 Pro ha trovato uno specifico controesempio: una funzione diversa che, in determinate condizioni, ha prestazioni leggermente ma indiscutibilmente migliori rispetto alla regola della maggioranza.
Ecco il controesempio che ha trovato per una configurazione specifica (p=0,4, n=5):
f(x) = sign(x_1 - 3x_2 + x_3 - x_4 + 3x_5)
Questa funzione ha ottenuto un punteggio di 0,43024, superando il punteggio della migliore funzione di maggioranza, pari a 0,42904.
Perché è importante: Si tratta di un problema fondamentale con enormi applicazioni pratiche. Trovare funzioni ottimali per il recupero del segnale ha un impatto diretto su come progettiamo i codici di correzione degli errori per l'archiviazione dati, i canali di comunicazione e il recupero dei dati. Confutando la vecchia ipotesi, GPT-5 Pro ha aperto un nuovo capitolo per la ricerca nel settore.





