Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
7章 線形モデル上のバンディット問題
Search
Takashi Nishibayashi
November 30, 2016
Technology
3
4.5k
7章 線形モデル上のバンディット問題
機械学習プロフェッショナルシリーズ輪読会 ~バンディット問題の理論とアルゴリズム~ の資料です
Takashi Nishibayashi
November 30, 2016
Tweet
Share
More Decks by Takashi Nishibayashi
See All by Takashi Nishibayashi
論文紹介 Improving Medical Reasoning through Retrieval and Self-Reflection with Retrieval-Augmented Large Language Models
hagino3000
0
530
論文紹介 Audience Size Forecasting Fast and Smart Budget Planning for Media Buyers
hagino3000
0
210
論文紹介 Towards a Fair Marketplace: Counterfactual Evaluation of the trade-off between Relevance, Fairness & Satisfaction in Recommendation Systems
hagino3000
1
570
論文紹介 Budget Management Strategies in Repeated Auctions (公開版)
hagino3000
0
250
論文紹介 A Request-level Guaranteed Delivery Advertising Planning: Forecasting and Allocation
hagino3000
0
85
論文紹介 Online Experimentation with Surrogate Metrics Guidelines and a Case Study
hagino3000
0
180
論文紹介 Bidding Machine: Learning to Bid for Directly Optimizing Profits in Display Advertising
hagino3000
0
110
論文紹介 Balancing Relevance and Discovery to Inspire Customers in the IKEA App
hagino3000
0
690
不確実性と上手く付き合う意思決定の手法
hagino3000
18
15k
Other Decks in Technology
See All in Technology
DevRelの始め方
moongift
PRO
1
390
『GRANBLUE FANTASY: Relink』最高の「没入感」を実現するカットシーン制作手法とそれを支える技術
cygames
1
140
突撃! 隣のAmazon Bedrockユーザー 〜YouはどうしてAWSで?〜
minorun365
PRO
3
390
【株式会社ELYZA】|GENIAC成果報告会 自社開発モデルプレゼンテーション
elyza
1
290
リアルお遍路+SORACOM IoT
ozk009
1
140
Classmethod AI Talks(CATs) #1 司会進行スライド(2024.09.19) / classmethod-ai-talks-aka-cats_moderator-slides_vol1_2024-09-19
shinyaa31
0
110
PDF Viewer作成の今までとこれから
hunachi
0
470
Mocking in Rust Applications
taiki45
2
410
「家族アルバム みてね」における運用管理・ オブザーバビリティの全貌 / Overview of Operation Management and Observability in FamilyAlbum
isaoshimizu
4
160
言葉は感情の近似値である。その感情と言葉の誤差を最小化しよう ~コミュニケーションにおけるアナログ/デジタル変換の課題に立ち向かう~
nktamago
0
230
LINEヤフーのフロントエンド組織・体制の紹介
lycorp_recruit_jp
1
1.2k
watsonx.ai Dojo 環境準備について
oniak3ibm
PRO
0
310
Featured
See All Featured
Being A Developer After 40
akosma
84
590k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
109
6.9k
Building Your Own Lightsaber
phodgson
101
6k
Designing the Hi-DPI Web
ddemaree
278
34k
Why You Should Never Use an ORM
jnunemaker
PRO
53
8.9k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.3k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3.4k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
166
48k
The Straight Up "How To Draw Better" Workshop
denniskardys
230
130k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
41
6.5k
GitHub's CSS Performance
jonrohan
1030
450k
Web development in the modern age
philhawksworth
205
10k
Transcript
ষ ઢܗϞσϧ্ͷόϯσΟοτ ػցֶशϓϩϑΣογϣφϧγϦʔζྠಡձ dόϯσΟοτͷཧͱΞϧΰϦζϜ<>d !IBHJOP 5BLBTIJ/JTIJCBZBTIJ <>ʮόϯσΟοτͷཧͱΞϧΰϦζϜʯຊଟ३ʗதଜಞɾஶ
ࣗݾհ ID: hagino3000 Name: ྛ (Takashi Nishibayashi) Job: Software
Engineer ݱࡏΞυωοτϫʔΫࣄۀऀʹͯ৴ޮͷ࠷ దԽʹैࣄ (ೖࡳՁ֨ௐϩδοΫɾࠂબϩ δοΫͷઃܭ͔Β࣮·Ͱ)
ઢܗόϯσΟοτ s t e6 e4 e5 e3 e2 e1 ྫ
࢝T͔ΒऴUʹ͋ΔσʔλʹԿΒ͔ͷ ܦ࿏Λ௨ͯ͠ΞΫηε͢ΔͦΕͧΕͷࢬ FKͰະͷ௨৴ԆВK͕ੜ͡Δ͜ͷ࣌ ʹԿσʔλʹΞΫηεͨ࣌͠ʹཁ͠ ͨ௨৴࣌ؒΛ࠷খԽ͢ΔࣄΛߟ͑Δ
௨৴ωοτϫʔΫͷྫ T͔ΒUͷܦ࿏i㱨\ ʜ ^࣍ͷΑ͏ͳϕΫτϧai 㱨\ ^ͰදΘͤΔɽ ܦ࿏ϕΫτϧશମͷू߹ΛA\ai ^i 㱨\
^Ͱ͋ΒΘ͢ɽ ͜ͷ࣌ɼܦ࿏ai 㱨AΛ༻͍ͨ࣌ͷ௨৴࣌ؒВ В В В 5ʹରͯ͠
ΑΓҰൠతʹ ֤εϩοτϚγϯ͕d ࣍ݩͷϕΫτϧai 㱨A㱬RdʹରԠɽͦͷใु PSଛࣦ ͕ظͷޡ߲ࠩЏ t Λ༻͍ͨઢܗϞσϧ Ͱද͞ΕΔઃఆʹ͓͍ͯྦྷੵใुͷ࠷େԽΛࢦ͢ΛઢܗόϯσΟο τ
MJOFBSCBOEJU ͱΑͿɽ dcAcͰ͋Γ a1 , a2 ,,,a|A| ͕୯ҐߦྻͱͳΔ߹લষ·Ͱͷجຊతͳό ϯσΟοτʹରԠ͢Δɽ ઢܗόϯσΟοτͷจ຺Ͱଟ͘ͷ߹ʹ֤ީิߦಈ BDUJPO ͱΑ ΕΔɽ
ઢܗόϯσΟοτͷSFHSFU ใुظ࠷େͷߦಈ Λબ͠ଓ͚Δ߹ͱൺֱͨ࣌͠ͷଛࣦ 6$#ํࡦΛద༻ͨ͠߹ͷϦάϨοτKcAcʹରͯ͠0 KMPHT ɼcAc͕ ඇৗʹେ͖͘ͳΔ߹ʹผͷํࡦΛߟ͑Δඞཁ͕͋Δɽ
ྫ w 8FCαΠτ࠷దԽ w όϯσΟοτ࠷ద༧ࢉ w ઢܕܭըͷҰ෦ͷ͕ະ w όϯσΟοτઢܗܭը w
ߦಈͷީิcAc㱣
จ຺͖όϯσΟοτ ֤ߦಈͷಛྔ͕ai,t ͱ͍ͬͨܗͰ࣌ࠁʹΑΓҟͳΔΛऔΔ͜ͱΛڐ͢ઃ ఆɽ࠷୯७ͳઃఆͱͯ͠ɼ࣌ࠁUʹԠͨ͡จ຺͕ଘࡏ͢Δͷͷظ࠷େͷ ߦಈ࣌ࠁtʹΑΒͳ͍߹Λߟ͑Δɽ ߦಈͱจ຺ͷަޓ࡞༻ແ͠ˠظ࠷େͷσβΠϯ࣌ࠁtʹґଘ͠ͳ͍ σβΠϯʹΑΔಛྔ ΫϦοΫ ࣌ࠁUʹґଘ͢Δಛྔ ฏPSٳɼϢʔβʔͷྸ
FUDʜ
ߦಈͱจ຺ͷަޓ࡞༻͕͋ΔϞσϧ σβΠϯ͕ύλʔϯ ࣌ࠁUʹґଘ͢ΔϢʔβʔ ͷ͕ύλʔϯͷ߹ 3FHSFU֤࣌ࠁͰৗʹظ࠷େΛͱͬͨ߹ͱͷൺֱ
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ% σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1.
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1. ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ%
உ உ σβΠϯ" σβΠϯ# ϑΥϯτ"
ϑΥϯτ# உ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# ঁ σβΠϯ" σβΠϯ# ϑΥϯτ" ϑΥϯτ# σβΠϯͱϑΥϯτʹ͍ͭͯੑผͱ૬ޓ࡞༻͕͋Δͱͨ͠Ϟσϧ ྫͱͯ͠ใुࠂΛճදࣔͨ࣌͠ͷऩӹ $1. ࠂΩϟϯϖʔϯ" PS ࠂΩϟϯϖʔϯ# PS ࠂΩϟϯϖʔϯ$ PS ࠂΩϟϖʔϯ%
-JO6$#ํࡦ ઢܗϞσϧʹର͢Δ6$#ํࡦͰ͋Δ-JO6$#ํࡦ -JO6$#QPMJDZ ֤ߦಈ͝ͱͷ6$#είΞ ͜͜ͰЋt 0 㲋MPH5 Id d
x dͷ୯ҐߦྻɼA-1ߦྻ ͷٯߦྻɽ ޡ߲ࠩͷࢄɼύϥϝʔλ 2 > 0 2 0 , ↵ > 0
-JO6$#ͷ6$#είΞͷߏ ࣌ࠁUʹ͓͚Δ ߦಈJͷظͷਪఆ ࣌ࠁUʹ͓͚Δ ߦಈJͷظͷඪ४ภࠩ
ઢܗϞσϧ্ͷτϯϓιϯநग़ ਖ਼نϞσϧͰͷࣄޙ֬ͷܭࢉɽ ใुͷޡ߲ࠩЏ U ͕طͷࢄМͷਖ਼نʹै͏߹ Λߟ͑ΔͷВͷࣄޙΛར༻͢ΔͱΞϧΰϦζϜ Вͷࣄޙ͔֬Βαϯϓϧ
ޡ߲͕ࠩਖ਼نͰͳ͍߹ w ΫϦοΫͳͲͷϞσϧͰޡ߲ࠩࢄͱͳΓਖ਼نʹ ैΘͳ͍ w ਖ਼֬ͳࣄޙ͔ΒͷཚੜՄೳ͕ͩܭࢉ͕ඇৗʹෳࡶʹ ͳΔ w τϯϓιϯநग़Ͱਖ਼نΛԾఆͨ͠ΞϧΰϦζϜΛར༻ ͕ͯ͠ԿΒ͔ͷఆ3ʹ͍ͭͯྼΨεతͰ͋Εɼదͳ
МΛऔΔࣄͰখ͞ͳϦάϨοτΛୡͰ͖Δ w ࣮ݧతʹτϯϓιϯநग़-JO6$#ํࡦΑΓΑ͍ੑೳͱͳΔ ߹͕ଟ͍ w ΫϦοΫϞσϧͷΑ͏ʹͰ͋Δ߹ʹྼΨε ͷఆ3Λ༻͍Δͷ͕Ұൠత
࣮ݧͯ͠Έͨ w ࣮ίʔυ w IUUQTOCWJFXFSKVQZUFSPSHHJUIVCIBHJOPOPUFCPPLT CMPCNBTUFS.-1@CBOEJU$IBQJQZOC w ใुਅͷВͱਅͷࢄ͔Βੜͨ͠ w ޡ߲ࠩͷطͷࢄใुΛճ΄Ͳੜͤͯ͞ಘͨ
w ݁Ռ w ࣮ݧͰ5IPNQTPOநग़ͱ-JO6$#ͷ͕ࠩग़ͣ w ͨͩ͠ࠂ৴ใु͕ͦͷͰ؍ଌͰ͖ͳ͍ͷͰ-JO6$#͑ͳ͍ w 5IPNQTPOநग़ใु͕Εͯͳ͠ w ύϥϝʔλνϡʔχϯά w М ˠВͷࣄલ͕Ͱ͋Δͱߟ͑Δࣄʹ૬
ϩδεςΟοΫճؼϞσϧ্ͷ όϯσΟοτ ใु͕ͷ߹ʹΑΓదͨ͠Ϟσϧɽใु9J U 㱨\ ^ͷ֬ ͷใुΛߟ͑ͨ࣌ͷظ࠷େͷߦಈ Вͷࣄޙ͕ཉ͍͠ ˠਖ਼نͷΑ͏ͳดͨ͡ܗͰ͋ΒΘͤͳ͍ɽ ˠ͜ͷຊͰϥϓϥεۙࣅΛར༻
ˠͰۙࣅ
ϩδεςΟοΫճؼϞσϧ্ͷόϯ σΟοτͷੑೳ w ཧอূແ͍͕࣮༻্༗ޮΒ͍͠ w 4-4DPUU.VMUJBSNFECBOEJUFYQFSJNFOUTJOUIF POMJOFTFSWJDFFDPOPNZ
ใु͕ͷ߹ͷ࣮ݧ w ͔֬ʹଞͷΞϧΰϦζϜΑΓϩδεςΟοΫճؼϞσϧͷ 5IPNQTPOநग़ͷํ͕ੑೳ͕ྑ͍ w -JO6$#ɼใुͷޡ͕ࠩਖ਼نΛաఔͨ͠5IPNQTPOநग़ &QTJMPO(SFFEZΑΓѱ͘ͳͬͨ w ݁Ռϊʔτ IUUQTOCWJFXFSKVQZUFSPSHHJUIVCIBHJOPOPUFCPPLT
CMPCNBTUFS.-1@CBOEJU$IBQ@CJOBSZ@SFXBSEJQZOC