Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CompML : Elementary knowledge for 'Parameter-Fr...
Search
sarrrrry
January 15, 2021
Technology
1
110
CompML : Elementary knowledge for 'Parameter-Free Online Optimization'
sarrrrry
January 15, 2021
Tweet
Share
More Decks by sarrrrry
See All by sarrrrry
点過程の基礎とその周辺
sarrrrry
0
150
みずほ銀行の2021年大規模システム障害に関する考察
sarrrrry
1
140
CompML:PaperReading-PHM-No.1
sarrrrry
0
160
PaperReading-ExplainingKnowledgeDistillationByQuantifyingTheKnowledge
sarrrrry
0
35
Other Decks in Technology
See All in Technology
JTCや セキュリティチェックリストが夢の跡
nikinusu
1
720
「家族アルバム みてね」における運用管理・ オブザーバビリティの全貌 / Overview of Operation Management and Observability in FamilyAlbum
isaoshimizu
4
160
タイミーのレコメンドにおける ABテストの運用
ozeshun
1
190
Swift Testingのconfirmationを コードリーディング/Dive into Swift Testing confirmation
laprasdrum
2
260
2024年のナビゲーション・フォーカス対応:Composeでキーボード・ナビゲーションをサポートしよう
tahia910
0
110
20240911_New_Relicダッシュボード活用例
speakerdeckfk
0
110
DroidKaigi 2024 たすけて!ViewModel
mhidaka
5
960
DuckDB雑紹介(1.1対応版)@DuckDB座談会
ktz
6
1.4k
watsonx.ai Dojo 環境準備について
oniak3ibm
PRO
0
340
忙しい人のためのLangGraph概要まとめ
__ymgc__
1
190
Tricentisにおけるテスト自動化へのAI活用ご紹介/20240910Shunsuke Katakura
shift_evolve
0
200
サーバレスでモバイルアプリ開発! NTTコム「ビジネスdアプリ」のアーキテクチャ / The architecture of business d app
nttcom
12
250
Featured
See All Featured
What's in a price? How to price your products and services
michaelherold
242
11k
How to name files
jennybc
75
98k
For a Future-Friendly Web
brad_frost
174
9.3k
Robots, Beer and Maslow
schacon
PRO
157
8.2k
Infographics Made Easy
chrislema
239
18k
Facilitating Awesome Meetings
lara
49
6k
Embracing the Ebb and Flow
colly
83
4.4k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
0
120
GitHub's CSS Performance
jonrohan
1030
450k
GraphQLとの向き合い方2022年版
quramy
43
13k
Designing for humans not robots
tammielis
248
25k
Docker and Python
trallard
39
3k
Transcript
None
None
【目的】 典型的な確率的最適化手法 など で必要とされる、 やその他のパラメータの調整を不必要にする事。 【 】 • • •
• •
エキスパート統合問題 問題設定 • 東京ドームで行われたあるクイズ大会に参加 • 制限時間内に答えだと思った方向に移動する ◯ 外野側、✕ 内野側 •
◯✕クイズが 問出題され、成績上位者が2次予選に進める 問題が分からなくても優勝経験のある 人を発見して、同じ動きをすれば良い ◦ 正解率が高いはずの優勝経験のある人をエキスパートと呼ぶ事にする ◦ 人のエキスパートと問題出題者をまとめて環境と呼ぶ事にする 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 環境がプレイヤーのアルゴリズム を知った上で、予測 ・ となるクイズを出題する ような、最悪の場合の解析を行う手法 この手法から を求める事が多い? 畑埜晃平,
& 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 • 素朴な戦略 の真似をする
◦ ミスの回数 たかだか 回 • 分法 の多数決に従う ◦ ミスの回数 たかだか • 乱択 分法 から 様ランダムに 人選び、その決定に従う ◦ ミスの回数 たかだか 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在しない場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社. アルゴリズム の 誤り回数の期待値 エキスパートの 誤り回数の最小値
エキスパート統合問題 乱択2分法 再掲 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 別の問題設定 オンライン配分問題 複数の投資先の銘柄 あるいはアルゴリズムやサーバ等選択肢 が与えられたとき、 持っている資源をうまく配分する事で損失を最小化する問題を考える 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 エキスパートの予測集合の扱い • エキスパート統合問題 ◦ 乱択2分法の変更 重み付き平均アルゴリズム ▪ 単純な問題として定式化 •
どんなエキスパート統合問題 も確率ベクトル集合を予測集合とし、各エキスパート は常 に単位ベクトルを予測するものに限定した問題に還元できる 標準化 • 標準化したオンライン配分問題に対する を ヘッジアルゴリズム と呼ぶ • エキスパートの予測を単位ベクトルではなく、一般化して凸集合であるとした枠組み をオンライン凸最適化 と呼ぶ
エキスパート統合問題 エキスパート統合問題 標準形 ↪ 一般化 オンライン凸最適化問題 予測値集合 凸集合 ↪ 特殊ケース
オンライン線形最適化問題
論文 • ◦ ◦ 基準 をベースにした 推定量を用いて、 なオンライン最適化 手法の提案 他の論文解説はこちら
https://github.com/CompML/survey-stochastic-optimization/issues