[AtCoder Conference 2025] LLMを使った業務AHCの上⼿な解き⽅

LLMを使った業務AHCの上⼿な解き⽅株式会社 ALGO ARTIS プリンシパルアルゴリズムエンジニア松尾充 (@terry_u16)

講演者プロフィール松尾充 | マツオアタル @terry_u16 株式会社ALGO ARTIS プリンシパルアルゴリズムエンジニア
社会インフラチームリードアルゴリズムヒューリスティック 2033 (1270th) 3220 (5th) 成⼈男性アバターのすがた

講演者経歴成⼈男性アバターのすがた⼤学に⼊学して機械⼯学を勉強 2010 IHIという会社で戦闘機⽤ジェットエンジンを開発 2016 うっかり競技プログラミングにハマってしまう 2020
株式会社ALGO ARTIS⼊社 2022 アルゴチームのチームリードを押し付けられる（？） 2025

イントロダクション

プログラミングコンテストの世界⼤会に出場競技プログラミングの世界⼤会AtCoder World Tour Finals 2025 2024年の年間コンテスト成績上位12名が招待出場権を獲得！

vs OpenAI ⼤会2週間前にOpenAIのLLMエージェントが参戦発表 13⼈⽬の参加者としてエキシビションマッチが開催される

世界⼤会⼈類2位を達成！

世界⼤会⼈類2位を達成！ ……でもOpenAIの⽅が⼀枚上⼿

OpenAIすげー！でもどこまで業務AHCに使えるの？

競プロとLLM

アルゴリズム部⾨とヒューリスティック部⾨ AtCoderにはアルゴリズム部⾨‧ヒューリスティック部⾨の2つがあるアルゴリズム部⾨ヒューリスティック部⾨与えられた問題に対し実⾏時間内に正確な答えを出⼒するプログラムを作成する最適解を出すのが困難な問題に対しできるだけ良い答えを出⼒するプログラムを作成する
例：最短経路問題例：巡回セールスマン問題

LLMと競技プログラミングコーディング能⼒を競う競技プログラミングには深い考察が求められ LLMのコーディング⼒‧思考⼒のベンチマークに⽤いられてきたボードゲームとAI 競技プログラミングとLLM IBM Deep Blue : チェス
1997 Google DeepMind AlphaGo : 囲碁 2016 AlphaZero : チェス, 囲碁, 将棋 2017 AlphaCode : Codeforces中央値 2022 OpenAI o1 : Codeforces上位11% 2024 ALE-Agent : AHC上位12% 2025

LLMと競技プログラミング Google DeepMind AlphaCode Codeforces 上位54% 2022 2023 2024 2025
Google DeepMind AlphaCode 2 Codeforces 上位15% OpenAI o1 Codeforces 上位11% OpenAI o3 Codeforces 上位0.2% コーディング能⼒を競う競技プログラミングには深い考察が求められ LLMのコーディング⼒‧思考⼒のベンチマークに⽤いられてきた

LLMと競技プログラミング（アルゴリズム部⾨）ここ1〜2年でLLMの競技プログラミング性能も⼤きく向上 CodeforcesやICPC World Finalsで⼈間トップと同等以上の成績 https://x.com/MostafaRohani/status/1968360976379703569 https://arxiv.org/pdf/2502.06807 OpenAI o1は Codeforcesで
上位11%相当 OpenAI o3は Codeforcesで上位0.2%相当⼤学⽣向け⼤会 ICPC World Finalsで OpenAIのモデルが 12問全問正解 Gemini 2.5 は 12問中10問正解 (2/139位相当)

LLMと競技プログラミング（ヒューリスティック部⾨）ヒューリスティック部⾨は⽐較的AIの攻略が遅かったアルゴリズム部⾨より試⾏錯誤の⽐重が⾼い点がAIにとって難しいアルゴリズム部⾨ヒューリスティック部⾨正解が⼀つに定まっているため正答‧誤答の判断は容易解に⾄るまでの数学的思考⼒が重要⼀発で完成することは稀でフィードバックループを回す必要あり
少しずつ改善する試⾏錯誤能⼒が重要正答誤答コード ※どちらが⾼難易度という話ではなく、難しさの⽅向性が異なる AI 提出 78点 63点提出フィードバック

Sakana AIがALE-Agentを発表 2025/6にSakana AIが組合せ最適化問題を解くALE-Agentを発表試⾏錯誤を⼤量に並⾏で⾏うことが可能に初期プログラム改善版① 改善版② 改善版③ 性能の良かったコードをベースに
最良優先探索的な⼿法を⽤いてエージェントが繰り返し改善を⾏う初出の論⽂における性能評価では⼈間の上位11.8%程度の性能ただし問題の得意‧不得意の差はある

World Tour Finals

AtCoder World Tour Finals (AWTF)とは競技プログラミングの世界⼀を決める⼤会各部⾨ごとに前年の成績上位12名が⽇本に招待される 2024年 1 2
3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 2025年 2024年のヒューリスティック部⾨では概ね⽉に1回程度、計12回のコンテストが⾏われ、順位によってポイントが加算されるポイントの上位12名がAWTFに進出 2025/7/16 9時〜19時 (10時間)

OpenAI参戦⼤会の2週間前にOpenAIのスポンサー参画が発表⼈間 vs AIのエキシビションマッチが開催されることに正式な順位は⼈間12名のみで決まる解く問題はエキシビションと同じ正式な順位表 OpenAIも同じ問題に10時間取り組む使⽤されたモデル等の詳細は⾮公開
エキシビションマッチ

OpenAI参戦に対する反応アルゴリズム部⾨におけるLLMの⼤幅な性能向上は認知されていたがヒューリスティック部⾨はまだ⼈間有利との⾒⽅が⼤多数だったアルゴリズム部⾨では⼤きく躍進しているが⾃分は今のところALE-Agentに負けたことがないまだまだ⼈間が有利なのでは？とはいえOpenAIがわざわざ参戦したということはモデルにそれなりに⾃信があるのかも……？⼈間勝利 8
割 vs AI勝利 2 割くらいの感覚

最⼩の移動回数で全ロボットを⽬的地に移動 AWTFで出題された問題 AI vs 人間まとめ【 AtCoder World Tour Finals 2025
Heuristic エキシビジョン】 https://chokudai.hatenablog.com/entry/2025/07/21/190935 問題⽂概要 • 複数のロボットがある • ⾃由にロボットをグループにまとめられる • 同じグループのロボットは同時に移動可能 • 指定ロボット1台だけでも移動できる • 壁を追加で⾃由に配置できる⽬的グループ分け、壁の配置の⾃由度が⾼い難問ファイナリストでも苦戦する問題

対戦結果 OpenAIのエージェントはエキシビション2位という快挙⼤⽅の予想を上回る結果に参加した12名のファイナリストはいずれも相当な実⼒者その中で2位を獲得しているのはものすごい成果

解法の⽐較 Psyhoさんは1グループ解法で詰め切る OpenAIは複数グループのビームサーチでゴリゴリにチューニング Psyho (1.812×1012点) OpenAI (1.654×1012点) terry_u16 (1.442×1012点)

OpenAIと対戦してみての所感コーディング‧チューニングのスピードでは圧倒的に⼈間を上回る⼀⽅、発想次第で⼈間側にもまだ勝てる余地はある（容易ではない） LLMの得意なところ LLMの苦⼿なところアルゴリズムのチューニングを⼤量試⾏⼤⽅針が同じでも細部で差が付いたチューニング⼒当然ながら⼈間より圧倒的に速い多数の⽅針を並列で進⾏させ
終盤まで優位を保つことができていたコーディングスピード⾮公開だがそれなりに⾼いはず？松尾にコード書かせた⽅が安いのではコスト（？） 1位解法は全く違う解法で差が付いた⼈間側は終了後にさらにスコア改善時間次第で結果が変わった可能性も解法の質‧多様性

AWTFの⽣中継 AtCoder World Tour Finals 2025 Heuristic - YouTube https://www.youtube.com/watch?v=TG3ChQH61vE
chokudaiさん‧wataさんの⽣解説、ずんだもんによる(?)コード解説 PsyhoさんとOpenAIのデッドヒートなど⾒どころ満載

本番中の⽴ち回り 0 1 2 3 4 5 経過時
間 5 6 7 8 9 10 全ロボットを同じグループにする⽅針 (当たり⽅針) の可能性についてメモ ……が、その存在を忘れるロボット1体ずつ愚直に移動する初期解を提出ビームサーチを書こうとするも、 copilotにバグを埋め込まれる焼きなましをを書こうとするも、 copilotにバグを埋め込まれる壁なしの焼きなましを書いたが結果はイマイチ⼀瞬だけ暫定1位になる壁を追加するも、壁がない⽅が強いもろもろ改善を⼊れる OpenAIがまだ独⾛していてビビる 2位狙いに切り替え BFSをbitboard上で⾏うことで⾼速化⾊々試すも伸び悩む解を⾒ても焼きなましが天才すぎて考察が進まない暫定2位フィニッシュひたすらデバッグ（つらい）

競技者個⼈としての感想終盤まで改善し続けていたのは完全に予想外何よりもこの勝負の場に出てきてくれたことに拍⼿ OpenAIは本当にすごいこれは⾃明かもオンサイトコンテストは楽しいレジェンド勢のいる中で準優勝できたのは奇跡負けたけどなんだかんだ2位は嬉しい関係者の皆様、競技者の皆様、本当にありがとうございました！めちゃくちゃ楽しかったです！来年こそは負けません！！！

業務AHC計画作成最適化

ALGO ARTISとは？ Algorithm Artisan アルゴリズム職⼈アルゴリズムの職⼈として計画最適化を実現する

サプライチェーンの中の運⽤計画モノの調達から消費まであらゆるところで計画が⽴てられている調達物流⽣産配送消費資源輸⼊の配船計画化学品の⽣産計画陸運の配送計画

計画作成は複雑なパズルである運⽤上の様々な制約から、計画作成複雑なパズル状態となっている結果として納期遅延や余剰在庫などが⽣まれ企業の競争⼒を削いでいる膨⼤なExcel作業追加受注等による修正で毎⽇⻑時間作業業務複雑化による属⼈化限られた熟練者以外は計画策定不可⾮効率な計画による潜在損失納期を守る計画を⽴てるので精⼀杯

パズルを解くには様々な制約のもとでコスト‧リスクが低い解を⾒付けるこれは最適化問題なので、事実上の業務AHC 海外から⽯炭を船で運ぶ⽬的船着き場の数‧⽯炭購⼊契約制約条件船の積載量‧運賃‧滞船料評価指標極めて複雑な組合せ最適化問題

ヒューリスティック最適化組合せ最適化問題を解く⽅法としてヒューリスティック最適化を採⽤担当者の負担軽減やコスト‧リスク低減を実現         担当者負荷⼤時間の浪費属⼈化
⾮効率な計画運⽤コスト⾼計画のコスト効率向上人手不足解消     最適化焼きなましビームサーチ⾼付加価値作業への転換属⼈化解消

ALGO ARTISの事業ニーズに合わせた2つのソリューションを主に展開フルカスタマイズ型ソリューション汎⽤パッケージ型ソリューション

導⼊実績（⼀部）これまでに多数の企業様で導⼊実績あり運⽤開始後の契約継続率100%で、⾼く評価いただいているエネルギー交通製造業

LLMと業務AHC

LLMは計画策定業務に使えるのか？問題設定データ計画 LLM 問題設定データ最適化プログラム LLM 計画
LLMに計画策定させる⽅法として、直接⼊⼒データを読ませる⽅法と最適化プログラムを書かせる⽅法の2つが考えられる LLMに直接⼊⼒データを読ませる LLMに最適化プログラムを書かせる

LLMは計画策定業務に使えるのか？問題設定やデータをプロンプトで与えるのは無謀問題設定データ計画コンテキスト⻑の限界業務ではデータ量が多く、簡単にコンテキスト⻑を超える制約の検証精度の限界 LLMの論理的な検証精度は限界がある
誤りや⾒落としが発⽣計画策定は制約を遵守することが強く求められる制約の検証が不安定なのは致命的 LLM

LLMは計画策定業務に使えるのか？ソースコードを⽣成させるアプローチは可能性がある問題設定の分量の少なさ正しい制約の検証問題設定データ最適化プログラム LLM 計画コンテキスト⻑に収まる可能性がある
（バグがなければ）⼀貫性を持って正しく検証できるソースコードを出⼒すれば制約の検証は正しくできる OpenAIも上記のアプローチでコンテストに参加

最⼩の移動回数で全ロボットを⽬的地に移動 AWTFで出題された問題 AI vs 人間まとめ【 AtCoder World Tour Finals 2025
Heuristic エキシビジョン】 https://chokudai.hatenablog.com/entry/2025/07/21/190935 仕様 • 複数のロボットがある • ⾃由にロボットをグループにまとめられる • 同じグループのロボットは同時に移動可能 • 指定ロボット1台だけでも移動できる • 壁を追加で⾃由に配置できる⽬的グループ分け、壁の配置の⾃由度が⾼い難問こんな難問が全⾃動で解けるなら計画策定も全⾃動で解けるのでは...?

コンテストと実務の違い「制約の複雑さ」コンテストはシンプルで奥が深い問題が出題される • ロボットの仕様 • 壁の仕様問題⽂に記載の内容全て問題⽂に記載ルールはpdf1枚に収まる簡単さ！なのに奥が深くて⾯⽩い！多くの⼈に愛される理由
少ない仕様明確な仕様

コンテストと実務の違い「制約の複雑さ」 World Tour Finalsの問題⽂は短い 5分もあれば読める https://atcoder.jp/contests/awtf2025heuristic/tasks/awtf2025heuristic_a

コンテストと実務の違い「制約の複雑さ」実務は複雑量の多さだけでなく、隠れた制約が厄介⼤量の仕様暗黙知 • 稼働できる装置の台数 • 作業員の⼈数に限りがある • 倉庫のキャパシティ
• 納期 • などなど... 運⽤に必要な制約 • 休憩時間は連続して欲しい • 装置の負荷は分散させたい • 作業員の負荷は公平に • あまりに早すぎる⽣産はNG 計画策定者のノウハウ上記はほんの⼀例で、案件によっては100以上の仕様が存在する暗黙知はプロジェクトを進める中で徐々に明らかになってくる

コンテストと実務の違い「制約の複雑さ」アルゴリズムの難しさ制約の複雑さ LLMに全てを任せるには、実務領域は複雑すぎる実務領域 LLMが得意な領域 LLMは以下の2点が難しい • ⼤量の仕様を全⾃動で正確に実装 •
暗黙知を⾃動で引き出す Coding Agentを活⽤し、⼈間が並⾛して実装するのが現状の落とし所暗黙知はヒアリングを通じて⼈間が引き出す必要がある

コンテストと実務の違い「要件の曖昧さ」コンテストでは評価指標が明確に与えられるシンプルな数式不変‧定量化が容易解の良さの評価指標が明確な形で与えられ、⽬指す⽅向が分かりやすいシンプルな評価明確な評価 (1) https://atcoder.jp/contests/awtf2025heuristic/tasks/awtf2025heuristic_a 出典：(1)

コンテストと実務の違い「要件の曖昧さ」実務では様々な項⽬の評価が必要担当者から何度もフィードバックを受け、評価指標を調整する複雑な評価変化し続ける評価指標 • 制約を満たしているか？ • 納期に間に合っているか？ •
作業員の負荷は平等か？ • 計画にマージンはあるか？様々な⽬線の品質の評価納得いくまで調整正しく評価しないと良い計画は得られないお客様のレビューを通じてプロジェクト最後まで調整を続けていくお客様

コンテストと実務の違い「要件の曖昧さ」実務をLLMで⾃動化するハードルは⾼い LLMの得意なところ LLMの苦⼿なところアルゴリズムのチューニングを⼤量試⾏評価関数が固定であれば⾃動化可能チューニング⼒評価⽅法が変更されるとチューニングのやり直しが発⽣評価⽅法の変更
お客様にLLMと議論させるのは現実的には難しいヒアリングヒアリングを通じて互いに計画への理解を深めることが重要このプロセスで信頼関係を築き、⾼品質の計画を提供することで⾼く評価された安易なLLM代替はできない

LLM活⽤スタンス

AAのLLM活⽤スタンス • Coding Agent 導⼊ • デザインシステムを作成、MCP連携を⾏うことで統⼀感のあるデザイン • システム移⾏のデータ変換にLLM活⽤ •
チャットボットを導⼊し、お客様のサポートの⼀部を⾃動化 LLMの進化のスピードは脅威的で、無視していると時代に取り残される LLMエージェントに最適化問題を解かせ、実務で適⽤する範囲を模索中コンテストの過去問で上位のスコアを獲得できることを確認 LLMの得意な領域を⾒極めて積極的に活⽤ LLMの進化についていく

今後の展望 LLMの限界を理解した上で、プロダクトにLLMを活⽤する ALGO ARTISの悩み汎⽤ソリューションは共通のアルゴリズムを流⽤しているものの、個別の要求は都度実装を⾏っており、どうしてもお時間をいただいてしまう LLMで解決しようとしていること⾃然⾔語で指⽰を与えることで、LLMにプロダクトの機能拡張を⾏わせる研究エンジニア以外でも⼩さい要望に対応できるようにし、デリバリを⾼速化ソースコードを完全に⾃由に編集させるのは無謀だが、
LLMが変更する範囲を制限することでフィジビリティを確保する⽬論⾒

やるべきことは変わらない⼿段何を書くか？⼈が書くかAIが書くかは表層的な話ツールの進化で書く対象の抽象度が上がってきたが、「価値を⽣み出す」というエンジニアの⽬的は変わらない LLMをツールとしてどう上⼿く使っていくかが重要機械語⾼級⾔語オブジェクト指向
フレームワーク LLM ハードウェア動作処理の流れ概念‧モデル実現したいことより抽象的に... 抽象化

宣伝タイム

ALGO ARTIS プログラミングコンテスト2025 師⾛明⽇12/14 (⽇) 15:00〜19:00 にAHC058が開催されます！ https://atcoder.jp/contests/ahc058 賞品
順位賞(〜5位)‧順位抽選賞‧AA社員賞 terry_u16, yunix, gasin, G4NP0N 解説放送 2025/12/14 (⽇) 20:30〜21:30 wata_admin, kaede2020, terry_u16, itigo 懇親会 2026/1/9 (⾦) 19:00〜予定

2027卒学⽣さん向け新卒採⽤今年も新卒採⽤をスタートします！AtCoderJobsからご応募ください！〜1/13 AtCoderJobsから応募〜1/18 履歴書‧エントリーシート提出 1/31 集中選考会（会社説明‧グループワーク‧座談会） 2⽉頃⾯接（2回程度）
3⽉頃内定 2025年新卒メンバー (⼀部)

話を聞いてみたい！是⾮お気軽に社員までDMください！アトラクト会⾷会社の話から競プロの雑談まで良いお店にタダで⾏けちゃいます！いつも競プロの雑談ばかりしてる気がする Happy Hour! 毎⽉⽉末⽊曜⽇に開催される懇親会知ってる競プロerもいっぱいいるはず
実質競プロerオフ会

[AtCoder Conference 2025] LLMを使った業務AHCの上⼿な解き⽅

[AtCoder Conference 2025] LLMを使った業務AHCの上⼿な解き⽅

More Decks by terry-u16

Other Decks in Programming

Featured

Transcript