Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
レンズの下のLLM / LLM under the Lens
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Henry Cui
December 30, 2023
Programming
0
210
レンズの下のLLM / LLM under the Lens
Henry Cui
December 30, 2023
Tweet
Share
More Decks by Henry Cui
See All by Henry Cui
プロダクション言語モデルの情報を盗む攻撃 / Stealing Part of a Production Language Model
zchenry
1
230
Direct Preference Optimization
zchenry
0
420
Diffusion Model with Perceptual Loss
zchenry
0
480
Go with the Prompt Flow
zchenry
0
190
Mojo Dojo
zchenry
0
240
ことのはの力で画像の異常検知 / Anomaly Detection by Language
zchenry
0
660
驚愕の事実!LangChainが抱える問題 / Problems of LangChain
zchenry
0
290
MLOps初心者がMLflowを触る / MLflow Brief Introduction
zchenry
0
170
{{guidance}}のガイダンス / Guidance of guidance
zchenry
0
190
Other Decks in Programming
See All in Programming
AWS re:Invent 2025参加 直前 Seattle-Tacoma Airport(SEA)におけるハードウェア紛失インシデントLT
tetutetu214
2
130
CSC307 Lecture 09
javiergs
PRO
1
850
今更考える「単一責任原則」 / Thinking about the Single Responsibility Principle
tooppoo
2
950
「ブロックテーマでは再現できない」は本当か?
inc2734
0
1.1k
AIと一緒にレガシーに向き合ってみた
nyafunta9858
0
430
AI活用のコスパを最大化する方法
ochtum
0
110
Metaprogramming isn't real, it can't hurt you
okuramasafumi
0
130
CSC307 Lecture 11
javiergs
PRO
0
580
24時間止められないシステムを守る-医療ITにおけるランサムウェア対策の実際
koukimiura
2
170
あなたはユーザーではない #PdENight
kajitack
4
280
Amazon Bedrockを活用したRAGの品質管理パイプライン構築
tosuri13
5
890
ノイジーネイバー問題を解決する 公平なキューイング
occhi
0
130
Featured
See All Featured
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
130
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
420
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
160
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
320
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Side Projects
sachag
455
43k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Color Theory Basics | Prateek | Gurzu
gurzu
0
210
Agile that works and the tools we love
rasmusluckow
331
21k
Transcript
レンズの下のLLM 機械学習の社会実装勉強会第30回 Henry 2023/12/30
LLM開発 ▪ LLM開発に必要な機能 • プロンプトエンジニアリングの繰り返し • 実験管理・性能評価・結果比較 ▪ これらの機能を達成する急成長のレポジトリ trulens
2
TruLens-Eval ▪ カルフォルニアにある会社TruEraのプロダクト • MLのMonitor. Debug. Test.にフォーカス ▪ TruLens-EvalはLLMの実験管理のために開発された ▪
TruLens-Explainは深層モデルの解釈性のために開発された ▪ 今日はTruLens-Evalに入門 3
TruLens-Evalを使う ▪ ライブラリインストール pip install trulens-eval==0.19.0 • 最新版の0.20.0では不明のエラーでimportできなかった ▪ シンプルなllm_app
• 2つの引数はサポートされてない ▪ Feedbackのカスタマイズ ▪ trulens-evalコマンドでstreamlitを開く • streamlit-javascriptが必要 4
まとめ ▪ TruLens-Evalの基本的な使い方 ▪ 余力ある方はLangChainなどとの組み合わせ 5