Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Rettyにおけるデータ活用について
Search
takegue
May 10, 2018
Business
0
870
Rettyにおけるデータ活用について
takegue
May 10, 2018
Tweet
Share
More Decks by takegue
See All by takegue
不自然言語の自然言語処理: コード補完を支える最新技術
takegue
1
820
つかわれるプラットフォーム 〜デザイン編〜@DPM#2
takegue
2
12k
カルチャーとエンジニアリングをつなぐ データプラットフォーム
takegue
4
6.3k
toC企業でのデータ活用 (PyData.Okinawa + PythonBeginners沖縄 合同勉強会 2019)
takegue
4
1k
Sparse Overcomplete Word Vector Representations
takegue
0
200
Aligning Sentences from Standard Wikipedia to Simple Wikipedia
takegue
0
200
High-Order Low-Rank Tensors for Semantic Role Labeling
takegue
0
120
Dependency-based empty category detection via phrase structure trees
takegue
0
70
A simple pattern-matching algorithm for recovering empty nodes and their antecedents
takegue
0
110
Other Decks in Business
See All in Business
workx-company-profile
eastfields
0
21k
Japan Open Chain ホワイトペーパー
gugroup
0
270
(16枚)組織と集団の違いとは? 組織の「3要素」とは?
nyattx
PRO
3
2.1k
【エンジニア職】中途採用向け会社説明資料(テックファーム株式会社)
techfirm
0
4.2k
【After】サービス紹介資料③_HP掲載用
redeslide
0
490
経営に囚われ_現場が見えなくなってしまったPMの奮闘記.pdf
akihiro0038
2
6k
20241211_CMCNagoya_9
hideki_ojima
0
430
会社紹介資料 / ProfileBook
gpol
4
25k
AWS の生成 AI 最前線 : 顧客起点のイノベーション
icoxfog417
PRO
0
910
Sales Marker Culture Book(English)
salesmarker
PRO
1
3k
LayerX AI・LLM Division Deck
layerx
PRO
0
1k
ログラス会社紹介資料 新卒採用 ビジネス職[経営幹部候補]/ Loglass Company Deck
loglass2019
0
1.4k
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.1k
The Invisible Side of Design
smashingmag
298
50k
Building an army of robots
kneath
302
44k
StorybookのUI Testing Handbookを読んだ
zakiyama
27
5.3k
Scaling GitHub
holman
458
140k
4 Signs Your Business is Dying
shpigford
181
21k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Writing Fast Ruby
sferik
628
61k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
665
120k
How to Ace a Technical Interview
jacobian
276
23k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Statistics for Hackers
jakevdp
796
220k
Transcript
Retty におけるデータ活用 竹野 峻輔(TAKENO Shunsuke) 2018.05.09
自己紹介
竹野 峻輔 Retty では - 集計・分析基盤開発 / 分析 / 機械学習
- Web開発 (ログ〜ロジック 開発) - M.Eng. (自然言語処理) その他 - もくもくPython勉強会@Retty - 寄稿: Software Design 6月/ OR学会 特集「自 然言語処理と数理モデル」 - Qiita「負荷試験のためのノウハウと Webフレームワーク の負荷試験 (Python,Node,Go,PHP)」
Retty について
Rettyにおけるデータ活用の取り組みの紹介
キャッチコピー生成 (自然言語処理) (自動) 二戸産のそばを店内で製粉し、挽きたて・打ちたて・茹でたての「3たて」で提供 (人手) お婆ちゃんの家に遊びに来たような古民家で頂くコシの強いお蕎麦は美味 「AIが飲食店のキャッチコピー、優先度学習を採用したRetty」 (5/9) http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00275/050100002/ まとめページやおすすめのお店
/ユーザ レコメンド(情報推薦 ) Native App(iPhone) Web(desktop/mobile)
“バエ”な写真の発掘 (画像処理) キャッチコピー生成 (自然言語処理) (自動) 二戸産のそばを店内で製粉し、挽きたて・打ちたて・茹でたての「3たて」で提供 (人手) お婆ちゃんの家に遊びに来たような古民家で頂くコシの強いお蕎麦は美味 「AIが飲食店のキャッチコピー、優先度学習を採用したRetty」 (5/9)
http://tech.nikkeibp.co.jp/atcl/nxt/column/18/00275/050100002/ まとめページやおすすめのお店 /ユーザ レコメンド(情報推薦 ) Native App(iPhone) Web(desktop/mobile) 「【飯テロ注意】新世代 AIによるグルメサービス Rettyの進化」 https://qiita.com/taru0216/items/438bc9119d9c6c3ee86e
”ビッグデータ” あるあるの苦労話 ※ 個人の見解です
とりあえず溜まったデータはある データ周りの苦労話 1 実際 7~8割ぐらい使わない ほんとに欲しいデータは 無い/使えない/整っていない データセットとしてのアノテーションの基準が整っていない 前処理 9割
期待と現実のズレも割とビッグ 2 人間の感覚が基準で言語化 /数値化できない (≠ 機械的な基準) SOTAが 思ったよりも使えない .... 超えられない平均の壁
データ周りの苦労話 いきなりは精度はでない
手段が目的化する 3 AI(人工知能)が使いたい! ビッグデータ使ってすごいことしたい! データドリブンにしたい! データ周りの苦労話 SOTAの手法を使いたい
手段が目的化する 期待と現実のズレもビッグ とりあえず溜まったデータはある 2 3 1 → 5S(整理・整頓・清掃・清潔・躾) → 手法を使い方ではなくて、データ(が生まれる構造)の活かし方を考える
→ 最初に調整する / 短いイテレーションで MTGを開く → 超安全策 と チャレンジ策 必ず2つは用意する. 3つはあるとベスト → 「魔王を倒すことではなくて、倒して世界平和にするんだろう...!」 っ辛抱よく伝える → 「問題の難しさ把握するためにも一番簡単な方法とる」 それでもデータを使っていくことで価値がある
ベンチャーとして半歩先を踏み出すために
目的 データ 手段
目的 データ 手段 ほかの2つを広げる 努力する
目的 データ 手段 ほかの2つを広げる 努力する 個人の能力値 組織の能力値
プログラマよりもエンジニア、エンジニアよりもアーキテクトであれ - データの取得〜活用 / 評価 まで 詳しい人 が 密に携わる -
(収集) ログ量の調整 / 欲しいデータの取得 → ログ送信 〜 ログ基盤 に携わる - (実装) スケール性 / 効率性 / 妥当性 → 月間3000万UUに耐えうる良いロジック開発 - (評価) サービスの成長 → 精度評価 からの KPI 評価。 - (運用) サービスに統合した手法の評価・改良 → 機械学習周りはリリースしてからが本番... 個別の知見が他のステップの知見となる (データの作り方/運用が少ない機械学習) - しんどい が結果的に 手っ取り早い - 色々なところでの スピード感 (データは集めるまでに時間を要する) - できるまでわからない、効果実感 - 一気通貫でやれた方が アウトプットの質が上がる - 手法の提案よりもシステムの提案
食を通じて世界中の人々を Happy に fin. すべてはビジョンのために