Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
レンズの下のLLM / LLM under the Lens
Search
Henry Cui
December 30, 2023
Programming
230
0
Share
レンズの下のLLM / LLM under the Lens
Henry Cui
December 30, 2023
More Decks by Henry Cui
See All by Henry Cui
プロダクション言語モデルの情報を盗む攻撃 / Stealing Part of a Production Language Model
zchenry
1
250
Direct Preference Optimization
zchenry
0
450
Diffusion Model with Perceptual Loss
zchenry
0
510
Go with the Prompt Flow
zchenry
0
220
Mojo Dojo
zchenry
0
260
ことのはの力で画像の異常検知 / Anomaly Detection by Language
zchenry
0
700
驚愕の事実!LangChainが抱える問題 / Problems of LangChain
zchenry
0
310
MLOps初心者がMLflowを触る / MLflow Brief Introduction
zchenry
0
190
{{guidance}}のガイダンス / Guidance of guidance
zchenry
0
200
Other Decks in Programming
See All in Programming
Server-Side Kotlin LT大会 vol.18 [Kotlin-lspの最新情報と Neovimのlsp設定例]
yasunori0418
1
190
YJITとZJITにはイカなる違いがあるのか?
nakiym
0
250
クラウドネイティブなエンジニアに向ける Raycastの魅力と実際の活用事例
nealle
2
220
t *testing.T は どこからやってくるの?
otakakot
1
710
Spec-driven Development: How AI Changes Everything (And Nothing)
simas
PRO
0
250
AI時代のPhpStorm最新事情 #phpcon_odawara
yusuke
0
200
Agentic Elixir
whatyouhide
0
410
How We Benchmarked Quarkus: Patterns and anti-patterns
hollycummins
1
160
煩雑なSkills管理をSoC(関心の分離)により解決する――関心を分離し、プロンプトを部品として育てるためのOSSを作った話 / Solving Complex Skills Management Through SoC (Separation of Concerns)
nrslib
4
1k
SkillがSkillを生む:QA観点出しを自動化した
sontixyou
6
3.5k
🦞OpenClaw works with AWS
licux
1
240
Claude CodeでETLジョブ実行テストを自動化してみた
yoshikikasama
0
840
Featured
See All Featured
Typedesign – Prime Four
hannesfritz
42
3k
Tell your own story through comics
letsgokoyo
1
900
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
380
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
340
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
The Pragmatic Product Professional
lauravandoore
37
7.2k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
220
Making Projects Easy
brettharned
120
6.6k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
360
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.2k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.7k
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
340
Transcript
レンズの下のLLM 機械学習の社会実装勉強会第30回 Henry 2023/12/30
LLM開発 ▪ LLM開発に必要な機能 • プロンプトエンジニアリングの繰り返し • 実験管理・性能評価・結果比較 ▪ これらの機能を達成する急成長のレポジトリ trulens
2
TruLens-Eval ▪ カルフォルニアにある会社TruEraのプロダクト • MLのMonitor. Debug. Test.にフォーカス ▪ TruLens-EvalはLLMの実験管理のために開発された ▪
TruLens-Explainは深層モデルの解釈性のために開発された ▪ 今日はTruLens-Evalに入門 3
TruLens-Evalを使う ▪ ライブラリインストール pip install trulens-eval==0.19.0 • 最新版の0.20.0では不明のエラーでimportできなかった ▪ シンプルなllm_app
• 2つの引数はサポートされてない ▪ Feedbackのカスタマイズ ▪ trulens-evalコマンドでstreamlitを開く • streamlit-javascriptが必要 4
まとめ ▪ TruLens-Evalの基本的な使い方 ▪ 余力ある方はLangChainなどとの組み合わせ 5