Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
初めての機械学習PJを やってみて得た知見
Search
yaginuuun
November 05, 2019
Technology
2
4.5k
初めての機械学習PJを やってみて得た知見
Connehito Marché vol.6 〜機械学習・データ分析市〜 / 2019-11-05
にて発表
yaginuuun
November 05, 2019
Tweet
Share
More Decks by yaginuuun
See All by yaginuuun
メルカリホーム画面におけるレコメンド改善事例 - Long-tailを考慮した辞書拡張
shyaginuma
3
1.4k
メルカリにおけるA/Bテストワークフローの改善 これまでとこれから
shyaginuma
2
1.7k
メルカリにおけるA/Bテスト標準化への取り組み
shyaginuma
21
13k
A/BテストにおけるVariance reduction
shyaginuma
2
2.4k
過去コンペベースの学習をやってみたら意外と良かった話
shyaginuma
0
700
Kaggleもくもく会イントロ
shyaginuma
0
190
1on1 SQL Introduction at Globis
shyaginuma
1
1.3k
SlackへのKPI通知Botを作ったら いろいろ捗った話
shyaginuma
1
2.2k
BigQueryMLハンズオン勉強会
shyaginuma
3
920
Other Decks in Technology
See All in Technology
30代エンジニアが考える、エンジニア生存戦略~~セキュリティを添えて~~
masakiokuda
4
2k
モンテカルロ木探索のパフォーマンスを予測する Kaggleコンペ解説 〜生成AIによる未知のゲーム生成〜
rist
4
1.1k
Cloud Native PG 使ってみて気づいたことと最新機能の紹介 - 第52回PostgreSQLアンカンファレンス
seinoyu
1
180
Javaの新しめの機能を知ったかぶれるようになる話 #kanjava
irof
3
4.9k
PHPStan をできる限り高速化してみる
colopl
0
250
LINEギフトのLINEミニアプリアクセシビリティ改善事例
lycorptech_jp
PRO
0
240
ウェブアクセシビリティとは
lycorptech_jp
PRO
0
260
BCMathを高速化した一部始終をC言語でガチ目に解説する / BCMath performance improvement explanation
sakitakamachi
2
1.2k
Engineering Managementのグローバルトレンド #emoasis / Engineering Management Global Trend
kyonmm
PRO
6
980
チームの性質によって変わる ADR との向き合い方と、生成 AI 時代のこれから / How to deal with ADR depends on the characteristics of the team
mh4gf
4
330
Amazon GuardDuty Malware Protection for Amazon S3を使おう
ryder472
2
100
Explainable Software Engineering in the Public Sector
avandeursen
0
360
Featured
See All Featured
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.7k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7.1k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
102
18k
Rails Girls Zürich Keynote
gr2m
94
13k
Designing Experiences People Love
moore
141
23k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
21k
The Pragmatic Product Professional
lauravandoore
33
6.5k
The Invisible Side of Design
smashingmag
299
50k
Scaling GitHub
holman
459
140k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.3k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Transcript
初めての機械学習PJを やってみて得た知見 Connehito Marché vol.6 〜機械学習・データ分析市〜 グロービス 柳沼慎哉 / 2019-11-05
自己紹介 • データサイエンティスト@グロービス ◦ DW保守運用 ◦ ダッシュボード構築 ◦ プロダクト分析 ◦
レコメンド開発 ⬅ Now • 2018新卒(もうすぐ三年目!!) • kaggleもくもく会@麹町 運営してます twitter: @yaginuuun
会社紹介 • 国内最大規模の経営大学院、ビジネススクールを運営 • 最近e-learningへ進出(グロービス学び放題) ◦ 時間、場所の制約なく学べるサービスの提供 • 他にも色々やってます ◦
ベンチャーキャピタルによる投資 ◦ 書籍の出版 ◦ G1サミット(経営者会議)の運営
何をやったか グロービス知見録という自社メディアに学び放題への導線が存在
どうやったのか 従来の仕組み:タグ一致 • 知見録と学び放題でタグが一致したコンテンツを表示 • タグ運用が手動(たまに漏れが発生) 改良後:コンテンツ同士の類似度 • 知見録と学び放題で類似度の高いコンテンツを表示 •
タグに寄らず、関連コンテンツを表示できる(漏れが発生しない)
結果
結果
得た知見
• リーン的な考え方に近い(Minimum Viable Product) • 改善のポテンシャルが見える • 結果を見せながら議論できるので担当者間の連携がしやすくなる 知見① 簡単でも良いのでまず結果を見える形にする
• エムスリーの西場さんがおっしゃっていて、自分でやって改めて実感 ◦ 成功確率高い ◦ 工数少ない 知見② ルール→アルゴリズムへの置き換えは有効 エムスリーの機械学習チームビルディングの考え方 by
@m_nishiba / @Machine Learning Team Building Pitchより引用
• 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用 知見③ kaggleは役に立つ
• 今回のPJの一部のコードは過去にメルカリコンペに取り組んだ時のものを 流用 • こんな資料もあります:カグルとジツム 知見③ kaggleは役に立つ
まとめ • いろんな知見が得られた ◦ 超シンプルでも良いので一旦アウトプットを見える形にすると進みが良 い ◦ ルールベース → アルゴリズムベースへの置き換えは有効
◦ kaggleは役に立つ • 一方でやらなきゃいけないこともたくさん ◦ モデルの運用周り ◦ パイプライン設計、構築 ◦ 後々手を入れやすい設計、コーディング • 常にやっていき