Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rettyにおけるデータ活用について
Search
takegue
May 10, 2018
Business
0
920
Rettyにおけるデータ活用について
takegue
May 10, 2018
Tweet
Share
More Decks by takegue
See All by takegue
不自然言語の自然言語処理: コード補完を支える最新技術
takegue
1
880
つかわれるプラットフォーム 〜デザイン編〜@DPM#2
takegue
2
12k
カルチャーとエンジニアリングをつなぐ データプラットフォーム
takegue
4
6.5k
toC企業でのデータ活用 (PyData.Okinawa + PythonBeginners沖縄 合同勉強会 2019)
takegue
4
1.1k
Sparse Overcomplete Word Vector Representations
takegue
0
240
Aligning Sentences from Standard Wikipedia to Simple Wikipedia
takegue
0
230
High-Order Low-Rank Tensors for Semantic Role Labeling
takegue
0
130
Dependency-based empty category detection via phrase structure trees
takegue
0
90
A simple pattern-matching algorithm for recovering empty nodes and their antecedents
takegue
0
140
Other Decks in Business
See All in Business
イクシアス株式会社 会社紹介資料
ixyas
0
2.7k
未経験PdM40%のプロダクトマネージャー組織を作った過程でわかった再現性について
numashi
1
710
Outputをもう一歩先へ 〜あなたの現在地に合わせた、量や質など「もう一歩先の」Output〜
amixedcolor
2
270
フルカイテン株式会社 採用資料
fullkaiten
0
79k
元経営企画CSOのPMが語る 「プロダクトが創る事業戦略」のリアル
yjksmt
0
970
タケウチグループRecruit
takeuchigroup
0
9.6k
株式会社アペルザ_中途採用向け会社紹介資料
hr_team_aperza
4
130k
ホワイトプラス会社紹介資料 / wp_introduction
whiteplus_recruit
0
260
SimpleForm 会社紹介資料
simpleform
2
50k
AIがコードを書く時代にエンジニア組織が事業に貢献する仕組み / How engineering organizations can contribute to business in an age where AI writes code
bpstudy
0
140
ちゅらデータ会社紹介 / Chura DATA Inc.
churadata
0
700
会社紹介資料
gatechnologies
2
140k
Featured
See All Featured
Visualization
eitanlees
150
16k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Code Review Best Practice
trishagee
74
19k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
0
190
Raft: Consensus for Rubyists
vanstee
141
7.3k
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.3k
Producing Creativity
orderedlist
PRO
348
40k
Faster Mobile Websites
deanohume
310
31k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.7k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.7k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
Transcript
Retty におけるデータ活用 竹野 峻輔(TAKENO Shunsuke) 2018.05.09
自己紹介
竹野 峻輔 Retty では - 集計・分析基盤開発 / 分析 / 機械学習
- Web開発 (ログ〜ロジック 開発) - M.Eng. (自然言語処理) その他 - もくもくPython勉強会@Retty - 寄稿: Software Design 6月/ OR学会 特集「自 然言語処理と数理モデル」 - Qiita「負荷試験のためのノウハウと Webフレームワーク の負荷試験 (Python,Node,Go,PHP)」
Retty について
Rettyにおけるデータ活用の取り組みの紹介
キャッチコピー生成 (自然言語処理) (自動) 二戸産のそばを店内で製粉し、挽きたて・打ちたて・茹でたての「3たて」で提供 (人手) お婆ちゃんの家に遊びに来たような古民家で頂くコシの強いお蕎麦は美味 「AIが飲食店のキャッチコピー、優先度学習を採用したRetty」 (5/9) http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00275/050100002/ まとめページやおすすめのお店
/ユーザ レコメンド(情報推薦 ) Native App(iPhone) Web(desktop/mobile)
“バエ”な写真の発掘 (画像処理) キャッチコピー生成 (自然言語処理) (自動) 二戸産のそばを店内で製粉し、挽きたて・打ちたて・茹でたての「3たて」で提供 (人手) お婆ちゃんの家に遊びに来たような古民家で頂くコシの強いお蕎麦は美味 「AIが飲食店のキャッチコピー、優先度学習を採用したRetty」 (5/9)
http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00275/050100002/ まとめページやおすすめのお店 /ユーザ レコメンド(情報推薦 ) Native App(iPhone) Web(desktop/mobile) 「【飯テロ注意】新世代 AIによるグルメサービス Rettyの進化」 https://qiita.com/taru0216/items/438bc9119d9c6c3ee86e
”ビッグデータ” あるあるの苦労話 ※ 個人の見解です
とりあえず溜まったデータはある データ周りの苦労話 1 実際 7~8割ぐらい使わない ほんとに欲しいデータは 無い/使えない/整っていない データセットとしてのアノテーションの基準が整っていない 前処理 9割
期待と現実のズレも割とビッグ 2 人間の感覚が基準で言語化 /数値化できない (≠ 機械的な基準) SOTAが 思ったよりも使えない .... 超えられない平均の壁
データ周りの苦労話 いきなりは精度はでない
手段が目的化する 3 AI(人工知能)が使いたい! ビッグデータ使ってすごいことしたい! データドリブンにしたい! データ周りの苦労話 SOTAの手法を使いたい
手段が目的化する 期待と現実のズレもビッグ とりあえず溜まったデータはある 2 3 1 → 5S(整理・整頓・清掃・清潔・躾) → 手法を使い方ではなくて、データ(が生まれる構造)の活かし方を考える
→ 最初に調整する / 短いイテレーションで MTGを開く → 超安全策 と チャレンジ策 必ず2つは用意する. 3つはあるとベスト → 「魔王を倒すことではなくて、倒して世界平和にするんだろう...!」 っ辛抱よく伝える → 「問題の難しさ把握するためにも一番簡単な方法とる」 それでもデータを使っていくことで価値がある
ベンチャーとして半歩先を踏み出すために
目的 データ 手段
目的 データ 手段 ほかの2つを広げる 努力する
目的 データ 手段 ほかの2つを広げる 努力する 個人の能力値 組織の能力値
プログラマよりもエンジニア、エンジニアよりもアーキテクトであれ - データの取得〜活用 / 評価 まで 詳しい人 が 密に携わる -
(収集) ログ量の調整 / 欲しいデータの取得 → ログ送信 〜 ログ基盤 に携わる - (実装) スケール性 / 効率性 / 妥当性 → 月間3000万UUに耐えうる良いロジック開発 - (評価) サービスの成長 → 精度評価 からの KPI 評価。 - (運用) サービスに統合した手法の評価・改良 → 機械学習周りはリリースしてからが本番... 個別の知見が他のステップの知見となる (データの作り方/運用が少ない機械学習) - しんどい が結果的に 手っ取り早い - 色々なところでの スピード感 (データは集めるまでに時間を要する) - できるまでわからない、効果実感 - 一気通貫でやれた方が アウトプットの質が上がる - 手法の提案よりもシステムの提案
食を通じて世界中の人々を Happy に fin. すべてはビジョンのために