Solving olympiad geometry without human demonstrations

田中冬馬 2023/1/22 ShibuyAI No.4

自己紹介株式会社ブレインパッドデータサイエンティストとしてマーケティング分析，広告文の自動生成などの自然言語処理の業務に従事その他の活動 LLM 関連で論文執筆 Inductive-bias Learning: Generating
Code Models with Large Language Model Data Science wiki データ分析手法，AI 関連の技術のまとめサイト Qiita の執筆 @fuyu_quant 1

概要 Googe DeepMind の研究，Nature(2024/1/17) に掲載言語モデルと演繹的推論を組み合わせたAlphaGeometry を提案平面幾何学の問題限定でIMO 金メダリストの平均的なスコアに迫る正解率を達成 (SOTA)
演繹的推論だけで導けない補助項の生成に言語モデルを利用人間による注釈や問題文を使わず合成データだけで言語モデルを学習学習データ不足になりがちな数学などの領域に対する一つの指針となるフレームワーク ※IMO ．．．International mathmatical Olympaid( 国際数学オリンピック) 2

前提知識 DD(Deductive databse) http://www.mmrc.iss.ac.cn/~xgao/paper/jar-gdbase.pdf データベースを使い幾何学的な問題を演繹的に推論する手法 AR(Algebraic reasoning) 代数的な概念，原則，手法を用いて問題を解く方法論文のAppendix に記載
(※ 上記についての説明は含みませんが内容は理解できると思います) 3

背景・課題，目的 4

背景・課題背景定理証明能力は論理的な推論に精通し，広範な空間を探索する能力を必要とするため人工知能研究の一つの焦点定理証明は学習ベースの手法では困難と言われている課題学習データが少ない人間の証明を機械が検証可能な言語(Lean9 など) に翻訳したデータが少な
い特に幾何学は翻訳することが難しく証明例が非常に少ない 5

目的人によるデータ作成を行わずに合成データを作成する方法を提案合成データにより学習した言語モデルと演繹的推論をくみあわせる他手法 (AlphaGeometry) を使いIMO 金メダリストの平均スコアに迫るスコアを実証する． 6

手法 7

手法学習のための合成データの作成利用した言語モデル言語モデルの学習 AlphaGeometry の動作 8

学習のための合成データの生成右図にあるような“ 前提” からサンプリングを行う “ 前提“ から記号的演繹エンジン(DD+AR) を使い様々なtrue statements
を生成証明の中の部分的な演繹推論を取り出し，1 億個のユニークな証明のサンプルを生成 (IMO-AG-30 問題を含まないような) ・・・ ( 全部で55 個) 9

学習のための合成データの生成記号的演繹エンジン(DD+AR) を使い“ 前提” をもとにtrue statements を生成上記の場合，学習データサンプルは以下のようになる前提：ランダムサンプリングしたもの結論：“HA
⊥BC” 証明：“HA ⊥BC” 以外の緑色のノード 10

利用した言語モデル利用したライブラリ Meliad 人気のあるTransformer アーキテクチャを拡張し，長いシーケンスに対応させたものなどが含まれている https://github.com/google-research/meliad 言語モデルアーキテクチャ：(Transformer-XL with
sliding window ？) Meliad のベースラインモデルで採用されており，今回の研究では基本設定を使ったと記載があるためパラメータ：1 億5100 万 12 層埋め込み次元：1024 アテンションのヘッド：8 Tokenizer SentencePiece を単語モードで学習 11

言語モデルの学習 “ 前提, 結論, 証明” の順番で文字列を作成し，“ 前提, 結論” から“ 証明”
を生成するように言語モデルを学習このような学習を行うことで演繹的推論だけでは導けない補助項を生成できるようになる補助項の構築は以前から研究されていたが，手作業で作成されたテンプレートなどを活用しており人間の経験のサブセットに制限されていた言語モデルと組み合わせることで記号的演繹エンジン(DD+AR) で解ける以上の問題を解くことができる 12

AlphaGeometry の証明方法実行方法( 以下を繰り返す) 記号的演繹エンジンで与えられた記述から証明を試みる a. 証明できない場合に言語モデルにより補助項を追加する b. 設定最大反復回数：16
回ビームサーチ LLM の出力の上位512 個を用いて探索する 13

結果 14

結果テストデータセット 2000 年から現在までのIMO の公式問題から作成 AlphaGeometry が対象とする幾何学の問題に絞り作成幾何学的な不等式など，他の数学の領域を必要とする問題は対象外全部で30 題の問題を用意
全て学習データに含まれていないことを確認済み 15

結果 AlphaGeometry は30 問中25 問を解答 16

結果 10 種類のソルバーを使い比較 AlphaGeometry でSOTA を達成 17

結果人間にも難しい問題はAlphaGeometry の証明の長さに反映されている簡単な問題( 人間のscore>3.5) では人間のスコアと証明長に相関は見られない 18

まとめ 19

概要( 再掲) Googe DeepMind の研究，Nature(2024/1/17) に掲載言語モデルと演繹的推論を組み合わせたAlphaGeometry を提案平面幾何学の問題限定でIMO 金メダリストの平均的なスコアに迫る正解率を達成
(SOTA) 演繹的推論だけで導けない補助項の生成に言語モデルを利用人間による注釈や問題文を使わず合成データだけで言語モデルを学習学習データ不足になりがちな数学などの領域に対する一つの指針となるフレームワーク ※IMO ．．．International mathmatical Olympaid( 国際数学オリンピック) 20

関連するリンク公式ページ https://deepmind.google/discover/blog/alphageometry- an-olympiad-level-ai-system-for-geometry/ Nature https://www.nature.com/articles/s41586-023-06747-5 GitHub https://github.com/google-deepmind/alphageometry

Solving olympiad geometry without human demonst...

Solving olympiad geometry without human demonstrations

Toma Tanaka

More Decks by Toma Tanaka

Other Decks in Technology

Featured

Transcript

田中冬馬 2023/1/22 ShibuyAI No.4

自己紹介株式会社ブレインパッドデータサイエンティストとしてマーケティング分析，広告文の自動生成などの自然言語処理の業務に従事その他の活動 LLM 関連で論文執筆 Inductive-bias Learning: Generating

概要 Googe DeepMind の研究，Nature(2024/1/17) に掲載言語モデルと演繹的推論を組み合わせたAlphaGeometry を提案平面幾何学の問題限定でIMO 金メダリストの平均的なスコアに迫る正解率を達成 (SOTA)

前提知識 DD(Deductive databse) http://www.mmrc.iss.ac.cn/~xgao/paper/jar-gdbase.pdf データベースを使い幾何学的な問題を演繹的に推論する手法 AR(Algebraic reasoning) 代数的な概念，原則，手法を用いて問題を解く方法論文のAppendix に記載

背景・課題，目的 4

目的人によるデータ作成を行わずに合成データを作成する方法を提案合成データにより学習した言語モデルと演繹的推論をくみあわせる他手法 (AlphaGeometry) を使いIMO 金メダリストの平均スコアに迫るスコアを実証する． 6

手法 7

手法学習のための合成データの作成利用した言語モデル言語モデルの学習 AlphaGeometry の動作 8

学習のための合成データの生成右図にあるような“ 前提” からサンプリングを行う “ 前提“ から記号的演繹エンジン(DD+AR) を使い様々なtrue statements

学習のための合成データの生成記号的演繹エンジン(DD+AR) を使い“ 前提” をもとにtrue statements を生成上記の場合，学習データサンプルは以下のようになる前提：ランダムサンプリングしたもの結論：“HA

利用した言語モデル利用したライブラリ Meliad 人気のあるTransformer アーキテクチャを拡張し，長いシーケンスに対応させたものなどが含まれている https://github.com/google-research/meliad 言語モデルアーキテクチャ：(Transformer-XL with

言語モデルの学習 “ 前提, 結論, 証明” の順番で文字列を作成し，“ 前提, 結論” から“ 証明”

AlphaGeometry の証明方法実行方法( 以下を繰り返す) 記号的演繹エンジンで与えられた記述から証明を試みる a. 証明できない場合に言語モデルにより補助項を追加する b. 設定最大反復回数：16