CompML : Elementary knowledge for 'Parameter-Free Online Optimization'

【目的】典型的な確率的最適化手法などで必要とされる、やその他のパラメータの調整を不必要にする事。【】 • • •
• •

エキスパート統合問題問題設定 • 東京ドームで行われたあるクイズ大会に参加 • 制限時間内に答えだと思った方向に移動する ◯ 外野側、✕ 内野側 •
◯✕クイズが問出題され、成績上位者が２次予選に進める問題が分からなくても優勝経験のある人を発見して、同じ動きをすれば良い ◦ 正解率が高いはずの優勝経験のある人をエキスパートと呼ぶ事にする ◦ 人のエキスパートと問題出題者をまとめて環境と呼ぶ事にする畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題敵対的論法環境がプレイヤーのアルゴリズムを知った上で、予測・となるクイズを出題するような、最悪の場合の解析を行う手法この手法からを求める事が多い？畑埜晃平,
& 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題敵対的論法仮定全問正解のエキスパートこのページのみと置くが存在する場合 • 素朴な戦略の真似をする
◦ ミスの回数たかだか回 • 分法の多数決に従う ◦ ミスの回数たかだか • 乱択分法から様ランダムに人選び、その決定に従う ◦ ミスの回数たかだか畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題乱択２分法畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題敵対的論法仮定全問正解のエキスパートこのページのみと置くが存在する場合畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.

エキスパート統合問題敵対的論法仮定全問正解のエキスパートこのページのみと置くが存在しない場合畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社. アルゴリズムの誤り回数の期待値エキスパートの誤り回数の最小値

エキスパート統合問題乱択２分法再掲畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題別の問題設定オンライン配分問題複数の投資先の銘柄あるいはアルゴリズムやサーバ等選択肢が与えられたとき、持っている資源をうまく配分する事で損失を最小化する問題を考える畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.

エキスパート統合問題エキスパートの予測集合の扱い • エキスパート統合問題 ◦ 乱択２分法の変更重み付き平均アルゴリズム ▪ 単純な問題として定式化 •
どんなエキスパート統合問題も確率ベクトル集合を予測集合とし、各エキスパートは常に単位ベクトルを予測するものに限定した問題に還元できる標準化 • 標準化したオンライン配分問題に対するをヘッジアルゴリズムと呼ぶ • エキスパートの予測を単位ベクトルではなく、一般化して凸集合であるとした枠組みをオンライン凸最適化と呼ぶ

エキスパート統合問題エキスパート統合問題標準形 ↪ 一般化オンライン凸最適化問題予測値集合凸集合 ↪ 特殊ケース
オンライン線形最適化問題

論文 • ◦ ◦ 基準をベースにした推定量を用いて、なオンライン最適化手法の提案他の論文解説はこちら
https://github.com/CompML/survey-stochastic-optimization/issues

CompML : Elementary knowledge for 'Parameter-Fr...

CompML : Elementary knowledge for 'Parameter-Free Online Optimization'

sarrrrry

More Decks by sarrrrry

Other Decks in Technology

Featured

Transcript

【目的】典型的な確率的最適化手法などで必要とされる、やその他のパラメータの調整を不必要にする事。【】 • • •

エキスパート統合問題問題設定 • 東京ドームで行われたあるクイズ大会に参加 • 制限時間内に答えだと思った方向に移動する ◯ 外野側、✕ 内野側 •

エキスパート統合問題畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題敵対的論法環境がプレイヤーのアルゴリズムを知った上で、予測・となるクイズを出題するような、最悪の場合の解析を行う手法この手法からを求める事が多い？畑埜晃平,

エキスパート統合問題敵対的論法仮定全問正解のエキスパートこのページのみと置くが存在する場合 • 素朴な戦略の真似をする

エキスパート統合問題乱択２分法畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題乱択２分法畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題敵対的論法仮定全問正解のエキスパートこのページのみと置くが存在する場合畑埜晃平, & 瀧本英二.

エキスパート統合問題敵対的論法仮定全問正解のエキスパートこのページのみと置くが存在しない場合畑埜晃平, & 瀧本英二.

エキスパート統合問題乱択２分法再掲畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.

エキスパート統合問題エキスパートの予測集合の扱い • エキスパート統合問題 ◦ 乱択２分法の変更重み付き平均アルゴリズム ▪ 単純な問題として定式化 •

エキスパート統合問題エキスパート統合問題標準形 ↪ 一般化オンライン凸最適化問題予測値集合凸集合 ↪ 特殊ケース

論文 • ◦ ◦ 基準をベースにした推定量を用いて、なオンライン最適化手法の提案他の論文解説はこちら