Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rettyにおけるデータ活用について
Search
takegue
May 10, 2018
Business
0
850
Rettyにおけるデータ活用について
takegue
May 10, 2018
Tweet
Share
More Decks by takegue
See All by takegue
不自然言語の自然言語処理: コード補完を支える最新技術
takegue
1
820
つかわれるプラットフォーム 〜デザイン編〜@DPM#2
takegue
2
11k
カルチャーとエンジニアリングをつなぐ データプラットフォーム
takegue
4
6.2k
toC企業でのデータ活用 (PyData.Okinawa + PythonBeginners沖縄 合同勉強会 2019)
takegue
4
990
Sparse Overcomplete Word Vector Representations
takegue
0
190
Aligning Sentences from Standard Wikipedia to Simple Wikipedia
takegue
0
200
High-Order Low-Rank Tensors for Semantic Role Labeling
takegue
0
110
Dependency-based empty category detection via phrase structure trees
takegue
0
66
A simple pattern-matching algorithm for recovering empty nodes and their antecedents
takegue
0
100
Other Decks in Business
See All in Business
エキサイトホールディングス株式会社 - 会社説明 -
excitejp
PRO
0
960
Culture Deck(2024 Sep)
todoker
0
130
新卒エンジニア向け会社紹介資料/newgraduates-engineer
nextbeat
2
1.5k
ビジネス職中途採用向け会社説明資料/Mid-Career Recruitment2024
zozo_midcareer
1
12k
DevOps Topologies 10 years on: what have we learned about silos, collaboration, and flow? - ShipItCon 2024
matthewskelton
PRO
2
160
株式会社クオトミー COMPANY DECK_As_of_Sep2024
quotomy
1
120
ラピュタロボティクス会社紹介資料
rapyutarobotics
0
31k
Sustainability Report 2024|booost technolgies株式会社
booost
0
690
これまでに存在しない業務フローは どう作っていくか?ドメインエキスパートやビジネスサイド、 チーム一丸となって取り組むドメインモデリング
iwamatsu0430
6
1.1k
XENDOU会社概要(テスト用)
regaliz
0
220
VTホールディングス株式会社_会社紹介資料
vtholdings
0
5.7k
merpay-Overview
mercari_inc
5
150k
Featured
See All Featured
Making the Leap to Tech Lead
cromwellryan
128
8.8k
Principles of Awesome APIs and How to Build Them.
keavy
125
16k
What the flash - Photography Introduction
edds
67
11k
The Straight Up "How To Draw Better" Workshop
denniskardys
230
130k
The Mythical Team-Month
searls
218
43k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
248
20k
Happy Clients
brianwarren
96
6.6k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
103
48k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
354
29k
Teambox: Starting and Learning
jrom
131
8.7k
Pencils Down: Stop Designing & Start Developing
hursman
119
11k
ParisWeb 2013: Learning to Love: Crash Course in Emotional UX Design
dotmariusz
109
6.9k
Transcript
Retty におけるデータ活用 竹野 峻輔(TAKENO Shunsuke) 2018.05.09
自己紹介
竹野 峻輔 Retty では - 集計・分析基盤開発 / 分析 / 機械学習
- Web開発 (ログ〜ロジック 開発) - M.Eng. (自然言語処理) その他 - もくもくPython勉強会@Retty - 寄稿: Software Design 6月/ OR学会 特集「自 然言語処理と数理モデル」 - Qiita「負荷試験のためのノウハウと Webフレームワーク の負荷試験 (Python,Node,Go,PHP)」
Retty について
Rettyにおけるデータ活用の取り組みの紹介
キャッチコピー生成 (自然言語処理) (自動) 二戸産のそばを店内で製粉し、挽きたて・打ちたて・茹でたての「3たて」で提供 (人手) お婆ちゃんの家に遊びに来たような古民家で頂くコシの強いお蕎麦は美味 「AIが飲食店のキャッチコピー、優先度学習を採用したRetty」 (5/9) http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00275/050100002/ まとめページやおすすめのお店
/ユーザ レコメンド(情報推薦 ) Native App(iPhone) Web(desktop/mobile)
“バエ”な写真の発掘 (画像処理) キャッチコピー生成 (自然言語処理) (自動) 二戸産のそばを店内で製粉し、挽きたて・打ちたて・茹でたての「3たて」で提供 (人手) お婆ちゃんの家に遊びに来たような古民家で頂くコシの強いお蕎麦は美味 「AIが飲食店のキャッチコピー、優先度学習を採用したRetty」 (5/9)
http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00275/050100002/ まとめページやおすすめのお店 /ユーザ レコメンド(情報推薦 ) Native App(iPhone) Web(desktop/mobile) 「【飯テロ注意】新世代 AIによるグルメサービス Rettyの進化」 https://qiita.com/taru0216/items/438bc9119d9c6c3ee86e
”ビッグデータ” あるあるの苦労話 ※ 個人の見解です
とりあえず溜まったデータはある データ周りの苦労話 1 実際 7~8割ぐらい使わない ほんとに欲しいデータは 無い/使えない/整っていない データセットとしてのアノテーションの基準が整っていない 前処理 9割
期待と現実のズレも割とビッグ 2 人間の感覚が基準で言語化 /数値化できない (≠ 機械的な基準) SOTAが 思ったよりも使えない .... 超えられない平均の壁
データ周りの苦労話 いきなりは精度はでない
手段が目的化する 3 AI(人工知能)が使いたい! ビッグデータ使ってすごいことしたい! データドリブンにしたい! データ周りの苦労話 SOTAの手法を使いたい
手段が目的化する 期待と現実のズレもビッグ とりあえず溜まったデータはある 2 3 1 → 5S(整理・整頓・清掃・清潔・躾) → 手法を使い方ではなくて、データ(が生まれる構造)の活かし方を考える
→ 最初に調整する / 短いイテレーションで MTGを開く → 超安全策 と チャレンジ策 必ず2つは用意する. 3つはあるとベスト → 「魔王を倒すことではなくて、倒して世界平和にするんだろう...!」 っ辛抱よく伝える → 「問題の難しさ把握するためにも一番簡単な方法とる」 それでもデータを使っていくことで価値がある
ベンチャーとして半歩先を踏み出すために
目的 データ 手段
目的 データ 手段 ほかの2つを広げる 努力する
目的 データ 手段 ほかの2つを広げる 努力する 個人の能力値 組織の能力値
プログラマよりもエンジニア、エンジニアよりもアーキテクトであれ - データの取得〜活用 / 評価 まで 詳しい人 が 密に携わる -
(収集) ログ量の調整 / 欲しいデータの取得 → ログ送信 〜 ログ基盤 に携わる - (実装) スケール性 / 効率性 / 妥当性 → 月間3000万UUに耐えうる良いロジック開発 - (評価) サービスの成長 → 精度評価 からの KPI 評価。 - (運用) サービスに統合した手法の評価・改良 → 機械学習周りはリリースしてからが本番... 個別の知見が他のステップの知見となる (データの作り方/運用が少ない機械学習) - しんどい が結果的に 手っ取り早い - 色々なところでの スピード感 (データは集めるまでに時間を要する) - できるまでわからない、効果実感 - 一気通貫でやれた方が アウトプットの質が上がる - 手法の提案よりもシステムの提案
食を通じて世界中の人々を Happy に fin. すべてはビジョンのために