GPT-5 Proが最近、2つの異なる、そして非常に難解な数学の問題を解決し、その強力で新しいレベルの抽象的推論能力を披露しました。これらは単なる巧妙なトリックではありません。1つは国際数学オリンピック(IMO)レベルのベンチマーク問題の解決であり、もう1つは情報理論における長年の仮説を覆すものです。
注目すべきは、Googleの「Deep Think」モードのGemini 2.5 ProやAnthropicのClaude 4.5+といった主要な競合モデルが、これらの特定の問題についてまだ公にテストされていないという点です。
何が起きたのか、簡単に見ていきましょう。
1. 代数のパズル:津村の554番目の問題
これはどんな問題か? これは津村裕昭氏の問題集にある問題で、難易度は国際数学オリンピック(IMO)とほぼ同レベルです。課題は、2つの生成元を支配するルールによって定義される特定の数学的な群が「自明」(つまり、最も単純な群であること)であることを証明することです。その簡潔な表現から、AIが高度な数学的推論能力に到達したかどうかをテストするためのベンチマークとなっています。
GPT-5 Proは何をしたか? この問題を解決した初のAIモデルとなりました。モデルをテストした独立した数学者によると、GPT-5 Proはインターネットにアクセスすることなく、わずか15分で完全な証明を生成したとのことです。
なぜ重要なのか? これは進歩を直接測る指標となります。ほんの数ヶ月前には、「津村の554番目の問題を解決したLLMは存在しない」と題された研究論文が、現在のモデルにはそのようなタスクをこなす能力が欠けていると論じていました。GPT-5 Proの成功は、AIの推論能力がいかに驚異的な速さで進歩しているかを実証しています。
2. 情報理論におけるブレークスルー:多数決の最適性の反証
これはどんな問題か? 「NICD-with-erasures majority optimality」として知られるこの問題は、情報理論の分野のものです。2人の人間が、同じ信号の破損したバージョンを受け取るところを想像してみてください。彼らはそれぞれ、部分的なデータに基づいて関数を推測し、両者が同じものを推測する確率を最大化することを目指します。長い間、専門家は最良の戦略は「多数決関数」(本質的にはデータポイント間での民主的な投票)であると信じていました。
GPT-5 Proは何をしたか? この長年の信念が誤りであることを証明しました。最適な関数を解く代わりに、GPT-5 Proは特定の反例、つまり特定の条件下で多数決ルールよりもわずかに、しかし決定的に優れたパフォーマンスを発揮する別の関数を発見したのです。
特定のセットアップ(p=0.4, n=5)に対してGPT-5 Proが発見した反例は以下の通りです。
f(x) = sign(x_1 - 3x_2 + x_3 - x_4 + 3x_5)
この関数は0.43024というスコアを達成し、最良の多数決関数のスコアである0.42904を上回りました。
なぜ重要なのか? これは、非常に多くの実用的な応用が可能な基礎的な問題です。信号回復のための最適な関数を見つけることは、データストレージ、通信チャネル、データ復旧のための誤り訂正符号をどのように設計するかに直接影響します。古い仮説を覆すことで、GPT-5 Proはこの分野の研究に新たな章を開いたのです。





