Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理 @ クックパッド / nlp at cookpad
Search
himkt
July 07, 2019
Technology
1
480
自然言語処理 @ クックパッド / nlp at cookpad
https://connpass.com/event/135387/
himkt
July 07, 2019
Tweet
Share
More Decks by himkt
See All by himkt
Linformer: paper reading
himkt
0
350
RoBERTa: paper reading
himkt
1
300
NLP SoTA 勉強会 / ner_2019
himkt
2
1.3k
Interpretable Machine Learning 6.3 - Prototypes and Criticisms
himkt
2
130
ニューラル固有表現抽出 / Neural Named Entity Recognition
himkt
3
650
ニューラル固有表現抽出器を実装してみる / PyNER
himkt
6
2k
Spacyでお手軽NLP / NLP with spacy
himkt
0
970
Deep Learning Book 10その2 / deep learning book 10 vol2
himkt
2
170
ふわふわ系列ラベリング / ner 2018
himkt
5
840
Other Decks in Technology
See All in Technology
Automated Promptingを目指すその前に / Before we can aim for Automated Prompting
rkaga
0
100
【LT】ソフトウェア産業は進化しているのか? -Javaの想い出とともに- #jjug_ccc
takabow
0
170
「最高のチューニング」をしないために / hack@delta 24.10
fujiwara3
20
3.3k
【技術書典17】OpenFOAM(自宅で極める流体解析)2次元円柱まわりの流れ
kamakiri1225
0
200
クライアントサイドでよく使われる Debounce処理 をサーバサイドで3回実装した話
yoshiori
1
140
[AWS JAPAN 生成AIハッカソン] Dialog の紹介
yoshimi0227
0
140
[JAWS-UG金沢支部×コンテナ支部合同企画]コンテナとは何か
furuton
3
160
Figma Dev Modeで進化するデザインとエンジニアリングの協働 / figma-with-engineering
cyberagentdevelopers
PRO
1
420
独自ツール開発でスタジオ撮影をDX!「VLS(Virtual LED Studio)」 / dx-studio-vls
cyberagentdevelopers
PRO
1
170
急成長中のWINTICKETにおける品質と開発スピードと向き合ったQA戦略と今後の展望 / winticket-autify
cyberagentdevelopers
PRO
1
160
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
3.6k
AIを駆使したゲーム開発戦略: 新設AI組織の取り組み / sge-ai-strategy
cyberagentdevelopers
PRO
1
130
Featured
See All Featured
Designing Experiences People Love
moore
138
23k
Building Flexible Design Systems
yeseniaperezcruz
327
38k
Optimizing for Happiness
mojombo
376
69k
How to train your dragon (web standard)
notwaldorf
88
5.7k
Music & Morning Musume
bryan
46
6.1k
Art, The Web, and Tiny UX
lynnandtonic
296
20k
How STYLIGHT went responsive
nonsquared
95
5.2k
Why Our Code Smells
bkeepers
PRO
334
57k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
43
6.6k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
42
9.2k
Optimising Largest Contentful Paint
csswizardry
33
2.9k
Making the Leap to Tech Lead
cromwellryan
132
8.9k
Transcript
自然言語処理 @ クックパッド 研究開発部 リサーチエンジニア Makoto Hiramatsu <
[email protected]
>
/ 9 自己紹介 ! 平松 淳 (Makoto Hiramatsu) ! @himkt
(Twitter/GitHub) ! 2019 年新卒 (2018 年 5 月 ~ 内定者アルバイト) ! 自然言語処理してます ( nlpaper.challenge の運営をしています ) 2
None
国内レシピ 310 万品+ 月間利用者 約 5,500 万人 海外レシピ 241 万品+
月間利用者 約 4,100 万人
/ 9 クックパッドの R&D ! 最高のデータ環境 (DWH がすごい) ! おおよそすべてのデータが1箇所に集約されている
! 自由にクエリを投げてデータを解析できる! ! 自分で作ったアプリケーション,プロダクション環境まで ! Dockerfile を書く -> Hako (コンテナ管理システム) でデプロイ ! (https://github.com/eagletmt/hako) 5
/ 9 クックパッドの R&D (NLPer 目線) ! サービスで実際に使う機能をつくる ! クックパッド本体
+ さまざまなサービス ! 専門知識を持ったアノテータさんが常駐している ! タスクを思いついた! GitHub issue 作成 アノテーション ! 基礎レベルの解析も大事にしていく雰囲気があります ! スタッフが使える形態素解析の辞書管理ツール ! 継続的改善への取り組み: MeCab の辞書再学習 6
クックパッドの自然言語処理 アプリケーション (レシピ検索,分類,翻訳,調理手順分類,ご意見分類) 述語項構造解析 談話構造解析 構文解析 形態素解析 固有表現抽出 文脈レベル 格解析 同義表現認識 -
同義料理名辞書 - 食材名認識 - 材料名正規化 語彙曖昧性解消 構文レベル 単語レベル
格解析 同義表現認識 - 同義料理名辞書 - 食材名認識 - 材料名正規化 語彙曖昧性解消 アプリケーション
(レシピ検索,分類,翻訳,調理手順分類,ご意見分類) 述語項構造解析 談話構造解析 構文解析 クックパッドの自然言語処理 形態素解析 固有表現抽出 文脈レベル 構文レベル 単語レベル 基礎解析 × R&D! ✅ 大量トラフィックを捌ける ✅ 形態素解析より高段の言語解析ができる
大規模サービスの言語解析基盤に知見があるかた おしゃべりしたいです クックパッドの自然言語処理に興味をもってくださったかた ぜひぜひお気軽にお声がけください