Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成系AI/LLM に関する 注目アップデート ~MS Build 2023 編~
Search
oshima
June 01, 2023
5
2.5k
生成系AI/LLM に関する 注目アップデート ~MS Build 2023 編~
oshima
June 01, 2023
Tweet
Share
More Decks by oshima
See All by oshima
CCSE2023 大規模言語モデルのZero-shot Learningを用いたデータ構築と開発への応用
yujioshima
2
430
メルカリのLLMを使ったサービス開発の進め方
yujioshima
0
260
MLOps勉強会 そのEdgeAIはUXを 改善できるか
yujioshima
1
1.2k
Mercar Gears MercariにおけるEdgeAIについて
yujioshima
0
200
CCSE2020 メルカリにおけるEdgeAIを用いた 新たなUXの開発
yujioshima
0
300
MLSE モバイル向け機械学習モデル管理基盤
yujioshima
2
3.2k
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
520
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.1k
Keith and Marios Guide to Fast Websites
keithpitt
410
22k
Reflections from 52 weeks, 52 projects
jeffersonlam
347
20k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
28
2.1k
Site-Speed That Sticks
csswizardry
2
190
Statistics for Hackers
jakevdp
796
220k
A Philosophy of Restraint
colly
203
16k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
191
16k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Gamification - CAS2011
davidbonilla
80
5.1k
Transcript
生成系AI/LLM に関する 注目 アップデート ~MS Build 2023 編~ 株式会社メルカリ 大嶋悠司
Who am I? 大嶋@メルカリ 生成AI/LLMチーム テックリード
LLM!! Copilot!! PLUGIN!! AI Orchestration!!
Keynotesから
None
None
Copilot いっぱいCopilotが発表 • Windows Copilot • Microsoft 365 Copilot •
GitHub Copilot • Viva Copilot • Edge Copilot • Security Copilot • Dynamic365 Copilot
Copilot?? ばちくそにかっこいいデモ動画 (7:19 から) チャットでユーザをサポートするアプリ?
Copilot stack!!!
つまり Copilotとは: Foundation modelに支えられたアプリケーションであり、UX部分のこと
Plugin CopilotたちはPluginで拡張が可能になる!
ChatGPT Plugins
Plugin が互換に
どこでもPluginの恩恵を受けられるように
Office365 Copilotでも
Plugins
Copilot Stack
Foundation models
Model catalog
AI Orchestration
AI Orchestration
Grounding
Grounding ある証拠に基づいて(Ground)生成する
Orchestration
Prompt Flow
Prompt Flow
Orchestration
Safety
Keynotes だけじゃない! 深掘りセッションズ
Foundation models
State of GPT
GPT学習パイプライン
GPT学習パイプライン 事前学習言語モデル GPT(ベースモデル)やLLAMA 大規模な言語資源で LMを事前学習 トークナイザなどもここで決まる
GPT学習パイプライン SFTモデル Vicuna-13Bなど QAの形式になっている少量・高品質のデータ でのチューニング(数万オーダー) Instruction tuningともいう 「Assistant」にする学習
GPT学習パイプライン RLHF ChatGPT, Claude 生成された回答を人手でランキング付け 強化学習によって「より良い」回答を学習
なぜRLHFが必要なのか
なぜRLHFが必要なのか A: いい感じに動くから
なぜRLHFが必要なのか A: いい感じに動くから [2203.02155] Training language models to follow instructions
with human feedback
なぜRLHFが必要なのか A: いい感じに動くから [2203.02155] Training language models to follow instructions
with human feedback 生成よりも比較のほうが簡単であるという非対称 が潜在的な理由かも
RLHFによる悪影響
LLM使用のベストプラクティス • Chain of Thought (CoT) : “Let’s think step
by step” • Self-consistency : 複数の答えから選ばせる • ASK for Reflection : “Was the task accomplished?” • Tree of Thought : 複数の結果を維持し、うまくいったものを残す • 「Expertとして振る舞ってください」
検索による拡張
Grounding
Vector Search Isn’t Enough by Elastic
Embeddingとは
Vector search!
Hybrid search
Metaprompt / response Filtering
Vector search / Hybrid searchは当たり前になりつつある • Elastic search • Azure
cognitive search • Azure Cosmos DB • VartexAI matching engine • Pinecone • Qdrant • …
Build and maintain your company Copilot with Azure ML and
GPT-4
Retrieval Augmented Generation (RAG)
None
PromptFlow
PromptFlow • プロンプトのバージョニングをしたり • Groudness(どれだけデータに基づいているか )を測ったり
まとめ • Copilot Stackという整理されたマップをもらった ◦ Frontend, Orchestration などどこに当てはまるのかを整理すると責任がわかりやすい • 現状のLLMに関しても整理された
◦ パラメータ数だけでなくどのフェーズのモデルなのかが重要 ◦ ユースケースに合ったモデル選択 • VectorSeach, PromptFlowなどのOrchestrationツール ◦ Azureに今後充実していく
メルカリでの取り組み
複数のモデルに対応
社内での活用・習熟を促進
社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索
社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索 どの粒度でベクトル化を行うか • チャンクに切る • サマライズする • インストラクションつける
社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索 質問とドキュメントのドメインの差 • FAQであれば問題にならない • Two tower modelなどの導入
生成AI/LLM @メルカリ 絶賛募集中! 生成AI LLM専任チーム Software Engineer(Full Stack) - Mercari (
https://apply.workable.com/mercari/j/76EB5EB641/ ) 生成AI/LLM専任チーム Senior Product Manager - Mercari ( https://apply.workable.com/mercari/j/57A4BBD796/ )