Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
揭秘LLMOps: 讓LLM服務像火箭 般穩定高效的祕密!
Search
LINE Developers Taiwan
PRO
September 23, 2024
Technology
0
130
揭秘LLMOps: 讓LLM服務像火箭 般穩定高效的祕密!
Event: iThome Hello World Dev Conference
Speaker: Maggie Lee
LINE Developers Taiwan
PRO
September 23, 2024
Tweet
Share
More Decks by LINE Developers Taiwan
See All by LINE Developers Taiwan
從校園到職場 我的實習旅程
line_developers_tw
PRO
0
81
探索數據未來
line_developers_tw
PRO
0
6
MLE 的修煉之路
line_developers_tw
PRO
0
60
LINE 實習分享 & 國際黑客松參賽分享
line_developers_tw
PRO
0
36
在 GCP 運用 Parse 全家餐管理那堆 AI 應用的資料
line_developers_tw
PRO
0
33
40歲的我會給20歲的自己,關於軟體開發的7個建議
line_developers_tw
PRO
0
9.1k
從零到一:轉碼仔的實習攻略
line_developers_tw
PRO
0
56
如何在團隊發揮數據影響力: 以電商資料科學家為例
line_developers_tw
PRO
1
57
做Data超讚的 誰懂?
line_developers_tw
PRO
0
45
Other Decks in Technology
See All in Technology
20250328_OpenAI製DeepResearchは既に一種のAGIだと思う話
doradora09
PRO
0
150
ソフトウェア開発現代史: なぜ日本のソフトウェア開発は「滝」なのか?製造業の成功体験とのギャップ #jassttokyo
takabow
2
1.5k
Explainable Software Engineering in the Public Sector
avandeursen
0
350
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
20k
Proxmox VE超入門 〜 無料で作れるご自宅仮想化プラットフォームブックマークする
devops_vtj
0
120
モンテカルロ木探索のパフォーマンスを予測する Kaggleコンペ解説 〜生成AIによる未知のゲーム生成〜
rist
4
1.1k
Compose MultiplatformにおけるiOSネイティブ実装のベストプラクティス
enomotok
1
210
OPENLOGI Company Profile
hr01
0
61k
Multitenant 23ai の全貌 - 機能・設計・実装・運用からマイクロサービスまで
oracle4engineer
PRO
2
110
20250326_管理ツールの権限管理で改善したこと
sasata299
1
350
パスキーでのログインを 実装してみよう!
hibiki_cube
0
590
Vision Language Modelを活用した メルカリの類似画像レコメンドの性能改善
yadayuki
9
1.2k
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
227
22k
Done Done
chrislema
183
16k
The Invisible Side of Design
smashingmag
299
50k
YesSQL, Process and Tooling at Scale
rocio
172
14k
It's Worth the Effort
3n
184
28k
Unsuck your backbone
ammeep
670
57k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
118
51k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
22
2.6k
Fireside Chat
paigeccino
37
3.3k
Side Projects
sachag
452
42k
Automating Front-end Workflow
addyosmani
1369
200k
Transcript
揭秘LLMOps: 讓LLM服務像火箭 般穩定高效的祕密!
Maggie Lee LINE Taiwan, Machine Learning Engineer Education: 國立政治大學 中文系學士/
資科系碩士 Specialty: • Machine Learning • Large Language Model • Knowledge Graph
iThome CIO 21%↑ 各企業優先目標大改變 用AI強化分析與決策 20%↑ 用AI創新應用與服務
iThome CIO 35% 各企業優先目標大改變 用AI強化分析與決策 41% 用AI創新應用與服務
iThome CIO 37% 47% 加強企業數位轉型 提高員工生產力 採用GAI目的大調查
01 02 03 04 Faster Time to Market 如何優化合作模式 Reliability
and Quality 如何快速打造可靠的服務 Regulatory Compliance and Ethics 法規與倫理面的實際方案 LLMOps流程上存有什麼挑戰 05 總結 CONTENT
01 LLMOps流程上 存有什麼挑戰
MLOps到LLMOps流程/合作再進化 提升效率 看重商業價值創造 工程上需要LLM 即時支援use case LLM作為生產力增強器 1234 特點項目文字 特點項目
安全性 穩定性 紀錄prompt各 版本的表現差異 維持服務穩定性 服務安全性不只有 避免輸出歧視 還有更多可用工具
訓練模型的機會減少後 實驗有被好好紀錄嗎 2100 特點項目文字 特點項目 準確性成為LLM的關鍵因素 穩定性 紀錄prompt各 版本的表現差異 維持服務穩定性
安全性 服務安全性不只有 避免輸出歧視 還有更多可用工具 看重商業價值創造 工程上需要LLM 即時支援use case 提升效率
屬於GenAI LLMOps獨有的挑戰 LLM道德和法律愈發重要 安全性 服務安全性不只有 避免輸出歧視 還有更多可用工具 穩定性 紀錄prompt各 版本的表現差異
維持服務穩定性 看重商業價值創造 工程上需要LLM 即時支援use case 提升效率
02 Faster Time to Market 如何優化合作模式
文字生成開發流程 將任務轉換 成Prompt 深入瞭解 問題 優化模型 輸出品質 對內容進行 自動化審查 對內容進行
人工檢查 BO Legal Engineer PM Engineer Engineer Engineer BO Legal Engineer ????
Select Foundational Model Evaluate Results Prompt Engineering Room for improvement
Deploy to Production Enough Resource RAG Fine-tuning
以客服案件分類解釋器為例 不好意思 我在認證電話號碼時 無法收到認證碼(簡訊) 我該怎麼辦? Input 標籤: 政策 原因: 電話號碼內的Auth
Penalty History因用戶多 次認證被鎖定,無法完成 簡訊認證 Output 分類客訴案件 讓客服團隊可以快速統整 服務需要優化的地方 標籤有 產品、政策、活動、 系統問題、客服營運問題
R&R 混亂 完蛋!效能越改 越低怎麼辦 我覺得這個 prompt跟我分類 定義不一樣 我要修改prompt 以客服案件分類解釋器為例
將Prompt以CO-STAR 切分任務 Context Objective Style Tone Audience Response 以客服案件分類解釋器為例 Provider
Engineer Engineer BO Engineer BO BO confirmer BO Engineer Engineer Engineer Engineer Engineer
快速建立POC 決定是否使用 RAG or tuning 若準確度/正確度 低於60% 嘗試加入 model based
solution 討論服務 可接受的表現 與團隊討論預期效能 建議落在當前 平均表現正負10% R&R 混亂 優化到 什麼程度 完蛋!效能越改 越低怎麼辦 我覺得這個 prompt跟我分類 定義不一樣 我要修改prompt 以客服案件分類解釋器為例 我希望這個服務達 到90%的準確率 這個服務我有辦 法達到嗎?
快速建立POC 決定是否使用 RAG or tuning 若準確度/正確度 低於60% 嘗試加入 model based
solution 討論服務 可接受的表現 與團隊討論預期效能 建議落在當前 平均表現正負10% 整合服務 R&R 混亂 優化到 什麼程度 控制output 格式 完蛋!效能越改 越低怎麼辦 我覺得這個 prompt跟我分類 定義不一樣 我要修改prompt 以客服案件分類解釋器為例 我希望這個服務達 到90%的準確率 這個服務我有辦 法達到嗎?
03 Reliability and Quality 如何快速打造 可靠的服務
Make it more easy Select Foundational Model Evaluate Results Prompt
Engineering Room for improvement Deploy to Production Upload Test data
集中管理 – 方便管理不同project的prompt,提升效率。 Why use open-source LLMOps platform
成本透明- 開發專案需要多少金額清清楚楚 Why use open-source LLMOps platform
一目瞭然 - 簡化的prompt編輯和版本管理 Why use open-source LLMOps platform
紀錄不同prompt版本表現及差異 Why use open-source LLMOps platform
Input Prompt template metadata Upload test data Create mlflow exp.
Execute predict & evaluation Log template and performance Do retriever Input retriever metadata exp. Is exist • Prompt name • environmentName • X-Pezzo-Api-Key • X-Pezzo-Project-Id Edit prompt & deploy • DB connection info • Index name • 搜索的input對到test data的哪個欄位 Yes No Prompt name Prompt VersionSha model date score filename note 客服分類器V1 f9dfb462b52 gpt-4o 2024-08-28 0.853 8M-2W.csv 更改event定義 客服分類器V1 k8ehf452a34 gpt-4o 2024-08-27 0.749 8M-1W.csv 增加輸出繁體中文 • exp. name: {prompt_id} • Run_id: {promptVersionSha}-{date-string}
04 Regulatory Compliance and Ethics 法規與倫理面的 實際解決方案
AI 法案基本原則 七大 基本 原則 永續 發展 人類 自主 隱私
保護 透明 可解釋 資訊 安全 問責 隱私 保護
AI 法案基本原則 七大 基本 原則 永續 發展 人類 自主 隱私
保護 透明 可解釋 資訊 安全 問責 隱私 保護
Regulation Check 廣告文案生成 輸出文案就夠了嗎 單身男士進!女孩尋找伴 侶,可深處了解約會 預防高血壓中風腦溢血心 肌梗塞?中醫有解! 十年白髮變黑 竟靠這個小玩意
帶有情色以及 性暗示內容 過度宣稱療效 涉及改變身體外觀 例如:使頭髮烏黑。
Regulation Check 法規 • 化粧品標示宣傳廣告涉及虛偽誇大或醫療效能認定準則 • 藥品廣告法令及審查原則 • 食品衛生管理法….. 可用詞/
不可宣稱詞 • 涉及影響生理機能或改變身體結構之詞句 • 化妝品得宣稱詞句例示及不適當宣稱詞句列舉 • 食品通常可使用之詞句… 內部規則 • LINE Logo 規範 • 色情裸露 • 不當內容… 過往審核結果 • 搜尋相似的廣告來參考過往審核結果
Regulation Check 生成 廣告文案 Spam keyword Detection 廣告文案及 對應審查結果 歷史資料
Regulation Check 是否通過 採用 是否通過
System guard input System guard System guard LLM Generative model
output Prompt hacking ML Commons AI Safety ML Commons AI Safety Regulation check
Takeaway 01 02 03 串接 pezzo + Mlflow + gradio
輕鬆紀錄每次實驗 防止Prompt hacking / 增加AI common security Check / 法規檢查 串接開源LLMOps服務 實驗一指到位 針對LLM輸入及輸出安全主動出擊 文字生成專案 寫prompt不單是一個任務 以CO-STAR 切分子任務 開發優先順序/驗收對象一目瞭然
None