Kaggle Traveling Santa 2018 - 4th Place Solution

2019/01/18 @ PFN Teatime Tech Talk Kaggle Traveling Santa 2018
4th Place Solution 秋葉拓哉

Part 1 はじめに

Kaggle とは？ ⚫ 謎の職人が謎の行為に励む謎の空間 ⚫ 機械学習コンテストのプラットフォーム ⚫ 普段は主に企業から出てきた実データに対し参加者がモデルを作り精度を競う

Kaggle のサンタコンペとは？ ⚫ 毎年、冬になると Kaggle で開催される遊びのコンテスト ⚫ 問題は機械学習ではなく離散最適化とか ⚫
実データではなく人工データ

今日の話は？ ⚫ 今冬の Kaggle サンタコンペで 1874 チーム中 4 位・金メダルを獲得した ⚫
特に、PFN で作っている Optuna を使った ⚫ どんなことをしたのか簡単に解説

ちなみに: Kaggle の金メダルってどのぐらい難しいの？ ⚫ だいたい「Top 10 入賞」を意味する ⚫ 金メダルを
1 個取れば Kaggle Master 本当はそれに加えて銀メダル以上が 2 個必要だが、金メダルを実力で取れるレベルの人にとって銀メダルは参加賞ぐらい。（※銀メダルも初心者には結構大変、しかし金はそれよりさらに大変） ⚫ 金メダルを 5 個取れば Kaggle Grandmaster 5 個のうち 1個はチームを組まず一人で獲得する必要あり。いわゆる「ソロゴールド」。ちなみに僕は Kaggle Master で、金メダルはこれで 4 個目。

ちなみに ⚫ 岩田陽一 (NII) と一緒に出ました ⚫ 今回の問題は流石に会社と関係なすぎるので完全にプライベートでやりました

Part 2 問題説明

今年のサンタコンペ Traveling Santa 2018 - Prime Paths ⚫ 大体「巡回セールスマン問題 (TSP)」
⚫ まずは TSP を解説

巡回セールスマン問題 (TSP) ⚫ 全都市を巡る最短の経路を計算する問題 ⚫ NP 困難な古典的な問題で良く研究されている図: http://mathworld.wolfram.com/TravelingSalesmanProblem.html より

今年のサンタコンペ Traveling Santa 2018 - Prime Paths ⚫ 大体「巡回セールスマン問題 (TSP)」
⚫ ただし、「スコア＝通常の距離 + ペナルティ」ペナルティ: 10 の倍数回目の移動それぞれに関して ⚫ 頂点番号が素数の頂点から移動する場合 → ペナルティなし ⚫ そうでない場合 → このステップの移動距離 × 0.1 がペナルティ「謎ペナルティがたまに加わる TSP 亜種なんだな」程度の理解で今日の話はついてこれるはず

入力図: https://www.kaggle.com/thexyzt/xyzt-s-visualizations-and-various-tsp-solvers より

出力例図: https://www.kaggle.com/heisenbad/visualization-and-naive-algorithms より

Part 3 解法概要

入力頂点座標疎グラフ経路 ① 普通の TSP ペナルティを無視し距離を最適化 ② Prime
TSP ペナルティも考慮し最適化 LKH-2 K-opt Hillclimb 経路経路経路経路経路 Optuna Asynchronous Successive Halving 自作ソルバ K-opt Hillclimb α-nearness Merge Solution Kick

TSP ペナルティも考慮し最適化 LKH-2 K-opt Hillclimb 経路経路経路経路経路 Optuna Asynchronous Successive Halving 自作ソルバ K-opt Hillclimb α-nearness Merge Solution Kick 今日は省略 Part 4 Part 6 Part 5

Part 4 （普通の）TSP ソルバの仕組み

TSP ペナルティも考慮し最適化経路経路経路経路経路 Optuna Asynchronous Successive Halving 自作ソルバ K-opt Hillclimb α-nearness Merge Solution Kick LKH-2 K-opt Hillclimb

LKH-2 とは？ ⚫ TSP の現行最強ヒューリスティックソルバ ⚫ K-opt (Lin-Kernighan Heuristic) を
独自にもりもり改善しまくり効率的に実装 ⚫ Prime TSP の最適化のスタート地点として優れた経路を得るために使った上位のほぼ全チームは LKH-2 を同じように使ったのではないか

2-opt この繋ぎ変えで改善できる所を改善していく図: http://akira.ruc.dk/~keld/research/LKH/LKH-2.0/DOC/LKH_REPORT.pdf より

3-opt この繋ぎ変えで改善できる所を改善していく図: http://akira.ruc.dk/~keld/research/LKH/LKH-2.0/DOC/LKH_REPORT.pdf より

K-opt (Lin-Kernighan Heuristic) ⚫ 2-opt や 3-opt の一般化 ⚫ 今回我々が使ったのは
K=8 (8-opt) とか ⚫ K に対して指数的に計算量が増加する ⚫ 大きい K についての探索を現実的にする工夫が色々取り入れられている sequential exchange への限定など

LKH-2 全体 ⚫ 1 Trial = K-opt による局所最適解への到達 ⚫ 1
Run = 複数 Trial (1000 とか 106 とか) ⚫ Trial の間には「Kick」と呼ばれる、解を壊す操作が入る局所最適解を抜け出し次は違う局所最適解に到達するため

Part 5 我々の Prime TSP ソルバの仕組み

LKH-2 K-opt Hillclimb 入力頂点座標疎グラフ経路 ① 普通の TSP
ペナルティを無視し距離を最適化 ② Prime TSP ペナルティも考慮し最適化経路経路経路経路経路 Optuna Asynchronous Successive Halving α-nearness Merge Solution Kick 自作ソルバ K-opt Hillclimb

Prime TSP ソルバ ⚫ ペナルティを加味した最適化をする ⚫ LKH-2 の出した TSP の良い解からスタート
適当な初期解からの最適化では非現実的なぐらい時間がかかってしまう ⚫ Rust で書いた

Prime TSP ソルバ基本路線：ペナルティを加味した K-opt 工夫: (今日はついてこれる人少ないと思うので飛ばします) ⚫ LKH と似た枝刈りが使えないので
両側探索を用いて K-opt を効率的に探索 ⚫ セグメント木を用いた効率的な non-sequential 4-opt, 5-opt の探索 ⚫ 深い局所解から脱出するための解のマージを用いた kick

Part 6 によるチューニング

自作ソルバ K-opt Hillclimb LKH-2 K-opt Hillclimb 入力頂点座標疎グラフ経路
① 普通の TSP ペナルティを無視し距離を最適化 ② Prime TSP ペナルティも考慮し最適化経路経路経路経路経路 α-nearness Merge Solution Kick Optuna Asynchronous Successive Halving

背景 ⚫ LKH-2 には大量のハイパラがあるハイパラのマニュアルの PDF が 8 ページ ⚫
Prime TSP は局所解の脱出が難しい ⚫ スタートする TSP 解が良いと Prime TSP でも良い解になる傾向がある ⚫ 良い解が一杯作れると、混ぜ合わせることで更に良い解が作れることが分かった (解のマージを用いた kick)

Optuna の使い方 ⚫ ハイパラが多すぎる → 手法の理解と事前の実験であたりをつけた ⚫ LKH-2 の最適化は終わりがない（時間をつぎ込めばつぎ込むほど解が良くなっていくので）
→ ASHA によって枝刈りされた時のみ終了 ⚫ パラメタのエンコーディングの工夫最終的なパラメータは KICK_TYPE, KICKS, SEED。 ASHA + Random Search で最適化。 SEED は初期解を左右するので結果にそれなりに影響がある。 301 trials やっていた。

ASHA とは？

Optuna を使った TSP 解の発見 ⚫ Kaggle Kernel で公開されてる一番良いやつ: 1503092.15 ⚫
我々が手で見つけてたやつ: 1502661.47 ⚫ Optuna で見つかった一番良いやつ: 1502582.97 実際には、距離だけでなくペナルティも良いやつを初期解として選んでいた。

Part 7 おわりに

まとめ ⚫ 今年の Kaggle サンタコンペは TSP 亜種だった ⚫ LKH-2 と自作ソルバと
Optuna を使った ⚫ 1874 チーム中 4 位で金メダル獲得「Optuna を使って Kaggle で金メダルを取る」という個人的な野望を達成……！

Kaggle Traveling Santa 2018 - 4th Place Solution

Kaggle Traveling Santa 2018 - 4th Place Solution

More Decks by Takuya Akiba

Featured

Transcript