GPT-5 Pro 最近解決了兩個截然不同且極其困難的數學問題,展現了其強大的抽象推理能力已達到全新水平。這並非只是巧妙的把戲;其中一個解法挑戰了國際數學奧林匹亞(IMO)等級的基準問題,另一個則推翻了資訊理論中一個長久以來的假設。
值得注意的是,其主要競爭對手,例如 Google 的 Gemini 2.5 Pro(在「深度思考」模式下) 和 Anthropic 的 Claude 4.5+,尚未公開針對這些特定問題進行測試。
以下為事件的簡要說明。
1. 代數謎題:津村裕的第 554 號問題
這是什麼問題? 這個問題出自津村裕的問題集,難度約相當於國際數學奧林匹亞(IMO)。問題要求證明一個由兩個生成元及其規則所定義的特定數學群是「平凡的」(trivial),意即它是最簡單的群。由於其問題陳述簡潔,它已成為測試人工智慧是否具備高階數學推理能力的基準。
GPT-5 Pro 做了什麼? 它成為第一個解決此問題的人工智慧模型。根據測試該模型的獨立數學家所述,GPT-5 Pro 在沒有網路連線的情況下,僅花了 15 分鐘就產生了完整的證明。
為何這很重要? 這是衡量進展的直接指標。就在幾個月前,一篇題為《沒有大型語言模型解決津村裕第 554 號問題》的研究論文還認為,目前的模型缺乏執行這類任務的能力。GPT-5 Pro 的成功展現了人工智慧推理能力進步的驚人速度。
2. 資訊理論的突破:推翻「多數最優性」
這是什麼問題? 這個問題來自資訊理論,稱為「帶有抹除通道下的多數最優性問題」(NICD-with-erasures majority optimality)。想像有兩個人,他們都收到了同一訊號的損壞版本。他們各自根據自己收到的部分資料來猜測一個函數,目標是讓兩人猜出相同結果的機率最大化。長期以來,專家們相信最佳策略是「多數函數」(基本上就是對資料點進行民主投票)。
GPT-5 Pro 做了什麼? 它證明了這個長久以來的信念是錯誤的。GPT-5 Pro 並沒有去解出最佳函數,而是找到了一個特定的反例——一個在特定條件下,表現得比多數決規則略好但明確更優的函數。
以下是它在特定設定(p=0.4, n=5)下找到的反例:
f(x) = sign(x_1 - 3x_2 + x_3 - x_4 + 3x_5)
這個函數取得了 0.43024 的分數,擊敗了最佳多數函數的 0.42904 分。
為何這很重要? 這是一個具有龐大實際應用的基礎問題。為訊號恢復尋找最佳函數,直接影響到我們如何為資料儲存、通訊通道和資料恢復設計糾錯碼。藉由推翻舊有的假設,GPT-5 Pro 為該領域的研究開啟了新的篇章。





