Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

[AtCoder Conference 2025] LLMを使った業務AHCの上⼿な解き⽅

Avatar for terry-u16 terry-u16
December 13, 2025

[AtCoder Conference 2025] LLMを使った業務AHCの上⼿な解き⽅

2025/12/13 (土) にAtCoder Conference 2025で講演させていただいたスライドです。
https://atcoder.jp/contests/atcoderconference2025

Avatar for terry-u16

terry-u16

December 13, 2025
Tweet

More Decks by terry-u16

Other Decks in Programming

Transcript

  1. 講演者プロフィール 松尾 充 | マツオ アタル @terry_u16 株式会社ALGO ARTIS プリンシパルアルゴリズムエンジニア

    社会インフラチームリード アルゴリズム ヒューリスティック 2033 (1270th) 3220 (5th) 成⼈男性アバターのすがた
  2. LLMと競技プログラミング Google DeepMind AlphaCode Codeforces 上位54% 2022 2023 2024 2025

    Google DeepMind AlphaCode 2 Codeforces 上位15% OpenAI o1 Codeforces 上位11% OpenAI o3 Codeforces 上位0.2% コーディング能⼒を競う競技プログラミングには深い考察が求められ LLMのコーディング⼒‧思考⼒のベンチマークに⽤いられてきた
  3. Sakana AIがALE-Agentを発表 2025/6にSakana AIが組合せ最適化問題を解くALE-Agentを発表 試⾏錯誤を⼤量に並⾏で⾏うことが可能に 初期プログラム 改善版① 改善版② 改善版③ 性能の良かったコードをベースに

    最良優先探索的な⼿法を⽤いて エージェントが繰り返し改善を⾏う 初出の論⽂における性能評価では ⼈間の上位11.8%程度の性能 ただし問題の得意‧不得意の差はある
  4. AtCoder World Tour Finals (AWTF)とは 競技プログラミングの世界⼀を決める⼤会 各部⾨ごとに前年の成績上位12名が⽇本に招待される 2024年 1 2

    3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 2025年 2024年のヒューリスティック部⾨では 概ね⽉に1回程度、計12回のコンテストが⾏われ、 順位によってポイントが加算される ポイントの上位12名がAWTFに進出 2025/7/16 9時〜19時 (10時間)
  5. 最⼩の移動回数で全ロボットを⽬的地に移動 AWTFで出題された問題 AI vs 人間まとめ【 AtCoder World Tour Finals 2025

    Heuristic エキシビジョン】 https://chokudai.hatenablog.com/entry/2025/07/21/190935 問題⽂概要 • 複数のロボットがある • ⾃由にロボットをグループにまとめられる • 同じグループのロボットは同時に移動可能 • 指定ロボット1台だけでも移動できる • 壁を追加で⾃由に配置できる ⽬的 グループ分け、壁の配置の⾃由度が⾼い難問 ファイナリストでも苦戦する問題
  6. OpenAIと対戦してみての所感 コーディング‧チューニングのスピードでは圧倒的に⼈間を上回る ⼀⽅、発想次第で⼈間側にもまだ勝てる余地はある(容易ではない) LLMの得意なところ LLMの苦⼿なところ アルゴリズムのチューニングを⼤量試⾏ ⼤⽅針が同じでも細部で差が付いた チューニング⼒ 当然ながら⼈間より圧倒的に速い 多数の⽅針を並列で進⾏させ

    終盤まで優位を保つことができていた コーディングスピード ⾮公開だがそれなりに⾼いはず? 松尾にコード書かせた⽅が安いのでは コスト(?) 1位解法は全く違う解法で差が付いた ⼈間側は終了後にさらにスコア改善 時間次第で結果が変わった可能性も 解法の質‧多様性
  7. AWTFの⽣中継 AtCoder World Tour Finals 2025 Heuristic - YouTube https://www.youtube.com/watch?v=TG3ChQH61vE

    chokudaiさん‧wataさんの⽣解説、ずんだもんによる(?)コード解説 PsyhoさんとOpenAIのデッドヒートなど⾒どころ満載
  8. 本番中の⽴ち回り 0 1 2 3 4 5 経 過 時

    間 5 6 7 8 9 10 全ロボットを同じグループにする⽅針 (当たり⽅針) の可能性についてメモ ……が、その存在を忘れる ロボット1体ずつ愚直に移動する 初期解を提出 ビームサーチを書こうとするも、 copilotにバグを埋め込まれる 焼きなましをを書こうとするも、 copilotにバグを埋め込まれる 壁なしの焼きなましを書いたが 結果はイマイチ ⼀瞬だけ暫定1位になる 壁を追加するも、壁がない⽅が強い もろもろ改善を⼊れる OpenAIがまだ独⾛していてビビる 2位狙いに切り替え BFSをbitboard上で⾏うことで⾼速化 ⾊々試すも伸び悩む 解を⾒ても焼きなましが天才すぎて 考察が進まない 暫定2位フィニッシュ ひたすらデバッグ(つらい)
  9. ヒューリスティック最適化 組合せ最適化問題を解く⽅法としてヒューリスティック最適化を採⽤ 担当者の負担軽減やコスト‧リスク低減を実現 
 
 
 
 担当者負荷⼤ 時間の浪費 属⼈化

    ⾮効率な計画 運⽤コスト⾼ 計画のコスト効率向上 人手不足解消 
 
 最適化 焼きなまし ビームサーチ ⾼付加価値作業への転換 属⼈化解消
  10. LLMは計画策定業務に使えるのか? 問題設定 データ 計画 LLM 問題設定 データ 最適化プログラム LLM 計画

    LLMに計画策定させる⽅法として、直接⼊⼒データを読ませる⽅法と 最適化プログラムを書かせる⽅法の2つが考えられる LLMに直接⼊⼒データを読ませる LLMに最適化プログラムを書かせる
  11. LLMは計画策定業務に使えるのか? ソースコードを⽣成させるアプローチは可能性がある 問題設定の分量の少なさ 正しい制約の検証 問題設定 データ 最適化プログラム LLM 計画 コンテキスト⻑に収まる可能性がある

    (バグがなければ) ⼀貫性を持って正しく検証できる ソースコードを出⼒すれば制約の検証は正しくできる OpenAIも上記のアプローチでコンテストに参加
  12. 最⼩の移動回数で全ロボットを⽬的地に移動 AWTFで出題された問題 AI vs 人間まとめ【 AtCoder World Tour Finals 2025

    Heuristic エキシビジョン】 https://chokudai.hatenablog.com/entry/2025/07/21/190935 仕様 • 複数のロボットがある • ⾃由にロボットをグループにまとめられる • 同じグループのロボットは同時に移動可能 • 指定ロボット1台だけでも移動できる • 壁を追加で⾃由に配置できる ⽬的 グループ分け、壁の配置の⾃由度が⾼い難問 こんな難問が全⾃動で解けるなら 計画策定も全⾃動で解けるのでは...?
  13. コンテストと実務の違い「制約の複雑さ」 実務は複雑 量の多さだけでなく、隠れた制約が厄介 ⼤量の仕様 暗黙知 • 稼働できる装置の台数 • 作業員の⼈数に限りがある • 倉庫のキャパシティ

    • 納期 • などなど... 運⽤に必要な制約 • 休憩時間は連続して欲しい • 装置の負荷は分散させたい • 作業員の負荷は公平に • あまりに早すぎる⽣産はNG 計画策定者のノウハウ 上記はほんの⼀例で、案件によっては100以上の仕様が存在する 暗黙知はプロジェクトを進める中で徐々に明らかになってくる
  14. コンテストと実務の違い「制約の複雑さ」 アルゴリズムの難しさ 制約の複雑さ LLMに全てを任せるには、実務領域は複雑すぎる 実務領域 LLMが得意な領域 LLMは以下の2点が難しい • ⼤量の仕様を全⾃動で正確に実装 •

    暗黙知を⾃動で引き出す Coding Agentを活⽤し、⼈間が並⾛して実装するのが現状の落とし所 暗黙知はヒアリングを通じて⼈間が引き出す必要がある
  15. コンテストと実務の違い「要件の曖昧さ」 実務では様々な項⽬の評価が必要 担当者から何度もフィードバックを受け、評価指標を調整する 複雑な評価 変化し続ける評価指標 • 制約を満たしているか? • 納期に間に合っているか? •

    作業員の負荷は平等か? • 計画にマージンはあるか? 様々な⽬線の品質の評価 納得いくまで調整 正しく評価しないと良い計画は得られない お客様のレビューを通じてプロジェクト最後まで調整を続けていく お客様
  16. コンテストと実務の違い「要件の曖昧さ」 実務をLLMで⾃動化するハードルは⾼い LLMの得意なところ LLMの苦⼿なところ アルゴリズムのチューニングを⼤量試⾏ 評価関数が固定であれば⾃動化可能 チューニング⼒ 評価⽅法が変更されると チューニングのやり直しが発⽣ 評価⽅法の変更

    お客様にLLMと議論させるのは 現実的には難しい ヒアリング ヒアリングを通じて互いに計画への理解を深めることが重要 このプロセスで信頼関係を築き、⾼品質の計画を提供することで⾼く評価された 安易なLLM代替はできない
  17. AAのLLM活⽤スタンス • Coding Agent 導⼊ • デザインシステムを作成、MCP連携を⾏うことで統⼀感のあるデザイン • システム移⾏のデータ変換にLLM活⽤ •

    チャットボットを導⼊し、お客様のサポートの⼀部を⾃動化 LLMの進化のスピードは脅威的で、無視していると時代に取り残される LLMエージェントに最適化問題を解かせ、実務で適⽤する範囲を模索中 コンテストの過去問で上位のスコアを獲得できることを確認 LLMの得意な領域を⾒極めて積極的に活⽤ LLMの進化についていく
  18. ALGO ARTIS プログラミングコンテスト2025 師⾛ 明⽇12/14 (⽇) 15:00〜19:00 にAHC058が開催されます! https://atcoder.jp/contests/ahc058 賞品

    順位賞(〜5位)‧順位抽選賞‧AA社員賞 terry_u16, yunix, gasin, G4NP0N 解説放送 2025/12/14 (⽇) 20:30〜21:30 wata_admin, kaede2020, terry_u16, itigo 懇親会 2026/1/9 (⾦) 19:00〜予定