Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
食べログChatGPTプラグイン導入で見えてきた未来:データサイエンティストの向き合い方
Search
moritama
May 30, 2023
Technology
910
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
食べログChatGPTプラグイン導入で見えてきた未来:データサイエンティストの向き合い方
moritama
May 30, 2023
Other Decks in Technology
See All in Technology
白金鉱業Meetup_Vol.24_「AIエージェントは分けるほど良い」は本当か? / Is it true that “the more you divide AI agents, the better”?
brainpadpr
1
400
エラーバジェットのアラートのタイミングを考える.pdf
kairim0
0
160
【Cyber-sec+】経営層を"動かす"ための考え方
hssh2_bin
0
190
中期計画、2回作ってみた ~業務委託と正社員、両方の視点から~
demaecan
1
910
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
130
[チョークトーク資料]AWS DevOps Agent を使いこなす / AWS Dev Ops Agent Chalk Talk AWS Summit Japan 2026
kinunori
0
110
スキルと MCP ツール、責務をどう分けるか? AI が迷わないインターフェース設計の戦略
cdataj
1
1.1k
Android の公式 Skill / Android skills
yanzm
0
150
日本 Fintech 未来予測レポート 2027〜2028年(オリジナル版)
8maki
0
2.3k
エンジニアリング戦略の作り方 / Crafting Engineering Strategy
iwashi86
21
7k
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.5k
Claude Code の Sandbox 機能を Anthropic Sandbox Runtime(srt) で試そう!/lets-play-anthropic-sandbox-runtime
tomoki10
1
630
Featured
See All Featured
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
3.4k
How to Think Like a Performance Engineer
csswizardry
28
2.7k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.3k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
310
Principles of Awesome APIs and How to Build Them.
keavy
128
18k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
870
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
610
Skip the Path - Find Your Career Trail
mkilby
1
150
Six Lessons from altMBA
skipperchong
29
4.3k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
How to Talk to Developers About Accessibility
jct
2
230
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
62
44k
Transcript
© Kakaku.com Inc. All Rights Reserved. 1 ৯ϩάChatGPTϓϥάΠϯ ಋೖͰݟ͖͑ͯͨະདྷɿ σʔλαΠΤϯςΟετͷ͖߹͍ํ
גࣜձࣾΧΧΫίϜ ࡊະ
© Kakaku.com Inc. All Rights Reserved. 2 ⾃⼰紹介 森 菜都未
もり なつみ 株式会社カカクコム ⾷べログシステム本部 技術部 データサイエンスチーム 1994年⽣まれ。富⼭⾼等専⾨学校を卒業後、筑波⼤学の情報学群に3 年次編⼊学。機械学習研究室にて、楽しませる囲碁AIの研究を⾏う。 同⼤学⼤学院 システム情報⼯学研究科に進み、⾃然⾔語処理研究室に 移籍。画像キャプション⽣成分野で、囲碁の局⾯に対して解説を付与 する研究に従事。国際会議 IFIP ICEC2017にて同研究の論⽂が採択。 The Best Paper Honorable Mention Award受賞。 2019年新卒でソフトバンク株式会社に⼊社。データサイエンティスト としてモバイル事業領域の事業改善施策にプロジェクトリーダとして 従事。 2023年2⽉株式会社カカクコム⼊社。 現在は、⾷べログの先端領域推進を担当。
© Kakaku.com Inc. All Rights Reserved. 3 2023年5⽉6⽇(⼟)、⾷べログChatGPTプラグインリリース ⽇本企業初のChatGPTプラグイン提供で様々なメディアにも取り上げていただきました 2023年5⽉8⽇付
カカクコムのプレスリリースより(URL)
© Kakaku.com Inc. All Rights Reserved. 4 ChatGPTプラグインが無い場合のChatGPTの課題 実在しない店舗情報を返す →
嘘を⾔ってしまう 最新の情報を有していない 2023年5⽉25⽇時点のGPT-4での挙動(プラグイン無し)
© Kakaku.com Inc. All Rights Reserved. 5 ⾷べログChatGPTプラグインの機能 問い合わせ時点の⾷べログが持っている情報から実在する店舗情報を返す ChatGPTから⾷べログのページにアクセスし
予約が可能
© Kakaku.com Inc. All Rights Reserved. 6 ⾷べログChatGPTプラグインの開発でのデータサイエンスチームの役割 OpenAI社 ChatGPTプラグイン公開
⾷べログChatGPTプラグインリリース ⾷べログChatGPTプラグイン動作検証・公開申請 ChatGPTプラグイン調査 ステークホルダーとの協議:取組み決定 各部⾨との調整(法務・セキュリティ・インフラ) お店検索APIの開発 API以外のプラグインに必要な要素の準備 ChatGPTなど⼤規模⾔語モデルの 技術的な部分に責任を持つチーム
© Kakaku.com Inc. All Rights Reserved. 7 ⾷べログChatGPTプラグインの開発詳細を知りたい⽅へ ⾷べログChatGPTプラグインの開発の詳細については、Tabelog Tech
Blogをご覧ください!
© Kakaku.com Inc. All Rights Reserved. 8 これからお話しすること 1. データサイエンティストから⾒た⾷べログの⼤規模⾔語モデル活⽤の未来
2. データサイエンティストの向き合い⽅
© Kakaku.com Inc. All Rights Reserved. 9 データサイエンティストから⾒た ⾷べログの⼤規模⾔語モデル活⽤の未来
© Kakaku.com Inc. All Rights Reserved. 10 データサイエンティストと⼤規模⾔語モデルの関係 GPT(Generative Pre-Trained
transformer)、BERT(Bidirectional Encoder Representations from Transformer)などのAttentionベースの ニューラル⾔語モデルを理解し、使いこなせる チェック項⽬ ⾃然⾔語処理 スキルカテゴリ スキルレベル ★ ★ ★ データサイエンティストに必要なスキルの⼀つ: 「GPTなどのモデルを理解し、使いこなせる」 引⽤:⼀般社団法⼈データサイエンス協会-データサイエンティスト スキルチェックリスト データサイエンティストは⼤規模⾔語モデルを使いこなせる必要がある
© Kakaku.com Inc. All Rights Reserved. 11 ⼤規模⾔語モデルの特徴: ChatGPT登場前 ChatGPT登場前の代表的な⼤規模⾔語モデル
BERT 2018年にGoogleより公開。事前学習済みの BERTを要約タスクや機械翻訳タスクといった タスクごとにファインチューニングすることで タスクに特化したモデルを利⽤可能。 ファインチューニング前提 • ファインチューニング⽤の学習データの準備 • 学習⽤のリソース確保 • ファインチューニングの専⾨知識 ファインチューニングに必要なもの 特定のタスクごとにパラメータ更新が必要
© Kakaku.com Inc. All Rights Reserved. 12 ⼤規模⾔語モデルの特徴: ChatGPT登場後 ChatGPT登場後の代表的な⼤規模⾔語モデル
GPT-4 2023年にOpenAIより公開。ChatGPT Plus ユーザとOpenAI API経由での利⽤が可能。In- context learningで特定のタスクごとのファイ ンチューニングを⾏わなくても、それぞれの タスクに適⽤可能。 ファインチューニング不要 特定のタスクごとのパラメータ更新が不要 同じモデルを様々なタスクに適⽤可能
© Kakaku.com Inc. All Rights Reserved. 13 ⾷べログの⼤規模⾔語モデル活⽤の未来 ⼤規模⾔語モデルを活⽤した案件の増加 ローコストで様々なタスクに適⽤可能なモデルの登場
© Kakaku.com Inc. All Rights Reserved. 14 データサイエンティストの 向き合い⽅
© Kakaku.com Inc. All Rights Reserved. 15 データサイエンティストの業務 Ҿ༻ݩɿʮ*544ʴʮσʔλαΠΤϯεྖҬʯ λεΫߏਤʢதྨʣʯʢಠཱߦ๏ਓใॲཧਪਐػߏʣ
IUUQTXXXJQBHPKQKJO[BJTLJMMTUBOEBSEQMVTJUVJJUTTQMVTEBUB@TDJFODFIUNM
© Kakaku.com Inc. All Rights Reserved. 16 今回フォーカスしてお話しする場所 ˞෦ɺࣾʹͯฤू Ҿ༻ݩɿʮ*544ʴʮσʔλαΠΤϯεྖҬʯ
λεΫߏਤʢதྨʣʯʢಠཱߦ๏ਓใॲཧਪਐػߏʣ IUUQTXXXJQBHPKQKJO[BJTLJMMTUBOEBSEQMVTJUVJJUTTQMVTEBUB@TDJFODFIUNM
© Kakaku.com Inc. All Rights Reserved. 17 ⼤規模⾔語モデルを活⽤する案件でのアプローチ設計 ⼤規模⾔語モデルを使うべきか 使うとしたら
どの⼤規模⾔語モデルを使うか
© Kakaku.com Inc. All Rights Reserved. 18 ⼤規模⾔語モデルを使うべきかの判断 機械翻訳 要約
質問応答 ⽂章⽣成 キーワード抽出 エンべディング 感情分析 ⽂章の⾔い換え 1. 解きたい課題のタスクは何かを整理 ⾷べログの⼝コミ検索の 検索精度を改善したい エンべディング、要約、キーワード抽出、 感情分析 2. ⼤規模⾔語処理モデルの 得意とするタスクかを判断 解きたい課題 想定されるタスク ⼤規模⾔語モデルの得意とするタスク例
© Kakaku.com Inc. All Rights Reserved. 19 使うとしたらどの⼤規模⾔語モデルを使うかの判断:⼤規模⾔語モデルの利⽤⽅法分類 ⼤規模⾔語モデルのプラットフォームを利⽤ 商⽤利⽤可能なモデルを利⽤
完全⾃社開発して利⽤ ⼤規模⾔語モデルの利⽤⽅法分類 1 2 3 具体的な例 OpenAI API、Azure OpenAI Service、… Dolly 2.0、StableLM、RWKV、OpenCALM、… -
© Kakaku.com Inc. All Rights Reserved. 20 例. アプローチとして⼤規模⾔語モデルのプラットフォームを利⽤する場合 プラットフォームとしての利⽤の検討
˞ֻ͚෦ɺࣾʹͯฤू Ҿ༻ݩɿʮ*544ʴʮσʔλαΠΤϯεྖҬʯ λεΫߏਤʢதྨʣʯʢಠཱߦ๏ਓใॲཧਪਐػߏʣ IUUQTXXXJQBHPKQKJO[BJTLJMMTUBOEBSEQMVTJUVJJUTTQMVTEBUB@TDJFODFIUNM
© Kakaku.com Inc. All Rights Reserved. 21 プラットフォームとしての利⽤の検討 プラットフォーム 課⾦⽅式
コスト(gpt-3.5-turbo) ⼊⼒データの 利⽤ Rate limits ・・・ RPM TPM ・・・ Azure OpenAI Service 従量課⾦ $0.002 (1000トークンあたり) ⼆次利⽤なし 300 120,000 ・・・ OpenAI API 従量課⾦ $0.002(1000トークンあたり) ⼆次利⽤なし 3,500 90,000 ・・・ 要件に合うプラットフォームがあるかを調査して選択 RPM:モデルごとの1分あたりの要求数 TPM:モデルごとの1分あたりのトークン数 Azure OpenAI Serviceの⽅がTPMは多い Rate limitsは引き上げ可能? → 調査 APIやプラットフォームの仕様の把握など幅広い知識が求められる
© Kakaku.com Inc. All Rights Reserved. 22 ⼤規模⾔語モデルを活⽤した案件に必要な業務 プロジェク ト⽴ち上げ
アプローチ 設計 データ収集 データ処理 評価 業務への組 み込み 改善 プロジェク ト⽴ち上げ アプローチ 設計 プラットフォームとしての利⽤の検討 業務への組 み込み 改善 ⼤規模⾔語モデルを活⽤した案件に必要な業務 データサイエンティストの業務 AI領域の専⾨知識 APIの接続などの専⾨知識 • データの前処理 • 機械学習 • モデル評価 • etc.
© Kakaku.com Inc. All Rights Reserved. 23 ⼤規模⾔語モデルの利⽤に求められるスキル ⼤規模⾔語モデルのプラットフォームを利⽤ 商⽤利⽤可能なモデルを利⽤
完全⾃社開発して利⽤ 専⾨性 ⾼ 低 ⼤規模⾔語モデルの利⽤⽅法分類 • データ収集スキル • ⼤規模⾔語モデル構築のための専⾨ 知識 • ⼤規模データを扱うスキル • 商⽤利⽤可能な⼤規模⾔語モデル の把握 • ファインチューニングの知識 • プラットフォームとしての利⽤のた めの知識(APIの接続などの知識) 求められるスキル
© Kakaku.com Inc. All Rights Reserved. 24 ⼤規模⾔語モデルを活⽤した案件の増加でデータサイエンティストに求められること AI領域の専⾨知識 AI領域の専⾨知識
+ AI領域に隣接する領域の専⾨知識
© Kakaku.com Inc. All Rights Reserved. 25 We are hiring
!