Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
CompML : Elementary knowledge for 'Parameter-Fr...
Search
sarrrrry
January 15, 2021
Technology
1
120
CompML : Elementary knowledge for 'Parameter-Free Online Optimization'
sarrrrry
January 15, 2021
Tweet
Share
More Decks by sarrrrry
See All by sarrrrry
点過程の基礎とその周辺
sarrrrry
0
210
みずほ銀行の2021年大規模システム障害に関する考察
sarrrrry
1
160
CompML:PaperReading-PHM-No.1
sarrrrry
0
180
PaperReading-ExplainingKnowledgeDistillationByQuantifyingTheKnowledge
sarrrrry
0
41
Other Decks in Technology
See All in Technology
アプリにAIを正しく組み込むための アーキテクチャ── 国産LLMの現実と実践
kohju
0
230
AWS re:Invent 2025~初参加の成果と学び~
kubomasataka
1
200
マイクロサービスへの5年間 ぶっちゃけ何をしてどうなったか
joker1007
21
8.3k
Kiro を用いたペアプロのススメ
taikis
4
1.9k
_第4回__AIxIoTビジネス共創ラボ紹介資料_20251203.pdf
iotcomjpadmin
0
140
さくらのクラウド開発ふりかえり2025
kazeburo
2
1.2k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
9.9k
ペアーズにおけるAIエージェント 基盤とText to SQLツールの紹介
hisamouna
2
1.7k
AWSの新機能をフル活用した「re:Inventエージェント」開発秘話
minorun365
2
470
半年で、AIゼロ知識から AI中心開発組織の変革担当に至るまで
rfdnxbro
0
150
Microsoft Agent Frameworkの可観測性
tomokusaba
1
120
202512_AIoT.pdf
iotcomjpadmin
0
150
Featured
See All Featured
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
65
35k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
200
エンジニアに許された特別な時間の終わり
watany
106
220k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
51
47k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.3k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
Done Done
chrislema
186
16k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.6k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
410
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
0
1k
Transcript
None
None
【目的】 典型的な確率的最適化手法 など で必要とされる、 やその他のパラメータの調整を不必要にする事。 【 】 • • •
• •
エキスパート統合問題 問題設定 • 東京ドームで行われたあるクイズ大会に参加 • 制限時間内に答えだと思った方向に移動する ◯ 外野側、✕ 内野側 •
◯✕クイズが 問出題され、成績上位者が2次予選に進める 問題が分からなくても優勝経験のある 人を発見して、同じ動きをすれば良い ◦ 正解率が高いはずの優勝経験のある人をエキスパートと呼ぶ事にする ◦ 人のエキスパートと問題出題者をまとめて環境と呼ぶ事にする 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 環境がプレイヤーのアルゴリズム を知った上で、予測 ・ となるクイズを出題する ような、最悪の場合の解析を行う手法 この手法から を求める事が多い? 畑埜晃平,
& 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 • 素朴な戦略 の真似をする
◦ ミスの回数 たかだか 回 • 分法 の多数決に従う ◦ ミスの回数 たかだか • 乱択 分法 から 様ランダムに 人選び、その決定に従う ◦ ミスの回数 たかだか 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 乱択2分法 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在する場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 敵対的論法 仮定 全問正解のエキスパート このページのみ と置く が存在しない場合 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社. アルゴリズム の 誤り回数の期待値 エキスパートの 誤り回数の最小値
エキスパート統合問題 乱択2分法 再掲 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 畑埜晃平, & 瀧本英二. (2016). オンライン予測. 講談社.
エキスパート統合問題 別の問題設定 オンライン配分問題 複数の投資先の銘柄 あるいはアルゴリズムやサーバ等選択肢 が与えられたとき、 持っている資源をうまく配分する事で損失を最小化する問題を考える 畑埜晃平, & 瀧本英二.
(2016). オンライン予測. 講談社.
エキスパート統合問題 エキスパートの予測集合の扱い • エキスパート統合問題 ◦ 乱択2分法の変更 重み付き平均アルゴリズム ▪ 単純な問題として定式化 •
どんなエキスパート統合問題 も確率ベクトル集合を予測集合とし、各エキスパート は常 に単位ベクトルを予測するものに限定した問題に還元できる 標準化 • 標準化したオンライン配分問題に対する を ヘッジアルゴリズム と呼ぶ • エキスパートの予測を単位ベクトルではなく、一般化して凸集合であるとした枠組み をオンライン凸最適化 と呼ぶ
エキスパート統合問題 エキスパート統合問題 標準形 ↪ 一般化 オンライン凸最適化問題 予測値集合 凸集合 ↪ 特殊ケース
オンライン線形最適化問題
論文 • ◦ ◦ 基準 をベースにした 推定量を用いて、 なオンライン最適化 手法の提案 他の論文解説はこちら
https://github.com/CompML/survey-stochastic-optimization/issues