Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Langsmith入門 トレーシングとプロンプト管理を試す
Search
ttnyt8701
February 26, 2025
Programming
1
84
Langsmith入門 トレーシングとプロンプト管理を試す
【AWS活用 AI/ML/LLM #4】機械学習/大規模言語モデルのモニタリング、保守、セキュリティ
https://blueish.connpass.com/event/346463/
ttnyt8701
February 26, 2025
Tweet
Share
More Decks by ttnyt8701
See All by ttnyt8701
FastMCPでMCPサーバー/クライアントを構築してみる
ttnyt8701
2
99
LangChain Open Deep Researchとは?
ttnyt8701
2
68
Vertex AI Agent Builderとは?
ttnyt8701
3
100
A2A(Agent2Agent )とは?
ttnyt8701
1
220
Amazon Bedrock LLM as a Judgeを試す
ttnyt8701
1
24
Amazon Sagemaker Jump Startを用いて爆速でモデルを作成してみる
ttnyt8701
2
60
Amazon SageMaker Lakehouseでデータのサイロ化による課題を解決する
ttnyt8701
1
30
Amazon Bedrock Custom model importを試してみる
ttnyt8701
2
84
Prompt Cachingは本当に効果的なのか検証してみた.pdf
ttnyt8701
1
660
Other Decks in Programming
See All in Programming
AI Coding Agent Enablement in TypeScript
yukukotani
17
7.2k
『Python → TypeScript』オンボーディング奮闘記
takumi_tatsuno
1
140
TVer iOSチームの共通認識の作り方 - Findy Job LT iOSアプリ開発の裏側 開発組織が向き合う課題とこれから
techtver
PRO
0
710
AIにコードを生成するコードを作らせて、再現性を担保しよう! / Let AI generate code to ensure reproducibility
yamachu
7
6k
DevTalks 25 - Create your own AI-infused Java apps with ease
kdubois
2
120
JVM の仕組みを理解して PHP で実装してみよう
m3m0r7
PRO
1
250
Parallel::Pipesの紹介
skaji
2
870
TSConfigからTypeScriptの世界を覗く
planck16
2
1.3k
"使いづらい" をリバースエンジニアリングする UI の読み解き方
rebase_engineering
0
110
What Spring Developers Should Know About Jakarta EE
ivargrimstad
1
600
コードに語らせよう――自己ドキュメント化が内包する楽しさについて / Let the Code Speak
nrslib
5
1k
Zennの運営完全に理解した #完全に理解したTalk
wadayusuke
1
140
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
336
57k
Build The Right Thing And Hit Your Dates
maggiecrowley
35
2.7k
Faster Mobile Websites
deanohume
307
31k
Git: the NoSQL Database
bkeepers
PRO
430
65k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
29
9.5k
Automating Front-end Workflow
addyosmani
1370
200k
The Power of CSS Pseudo Elements
geoffreycrofte
76
5.8k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
137
34k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
106
19k
RailsConf 2023
tenderlove
30
1.1k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.5k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
1
79
Transcript
LangSmith入門 トレーシング・プロンプト管理を試す 立野 祐太 2025.02.27 ©BLUEISH 2025. All rights reserved.
立野 祐太 Yuta Tateno 普段はGo、GCPを用いたWEB開発をしています。 バックエンドエンジニア 自己紹介 ©BLUEISH 2024. All
rights reserved.
©BLUEISH 2025. All rights reserved. 目的 LangSmithの機能・導入のイメージを掴んでもらう
©BLUEISH 2025. All rights reserved. 対象者 ❏ LLMアプリ開発の初心者の方 ❏ LangSmithや類似ツールを使ったことがない人
©BLUEISH 2025. All rights reserved. 目次 1. LangSmithについて a. 主な機能
b. なぜ必要なのか c. その他特徴 d. プラン比較 e. Langfuseとの比較 2. LangSmithを試してみる a. トレース b. プロンプト管理 3. まとめ
©BLUEISH 2025. All rights reserved. LLMアプリケーション開発での課題 LLMでは以下の特性があります ❏ 非決定性である ❏
同じ入力でも毎回異なる出力を返すことがある ❏ 出力の正確性、自然さ、一貫性 が保証されない ❏ ハルシネーションを起こす 一貫した応答を求められるアプリケーションでは、これらは問題となります 👉 LangSmithで改善しよう
©BLUEISH 2025. All rights reserved. 🦜⚒LangSmithとは LLMアプリケーションの開発・運用・改善を支援するツール
©BLUEISH 2025. All rights reserved. 主な機能 ❏ トレーシング LLMのプロンプト、出力、実行ステップ、エラーなどリクエストの詳細を追跡 ❏
モニタリング 応答時間、エラー率、リクエスト数 などシステム全体の健康状態を監視 ❏ 監視 トレーシング・モニタリングからシステムの内部状態を可視化し異常の特定を支援 ❏ 自動評価 事前に設定した 評価指標とモデルの出力を自動で比較して評価 ❏ キューの注釈 人間のフィードバックを収集し、モデルの出力品質を評価・改善 ❏ プロンプト管理 プロンプトのバージョン管理や A/B テストを通じてプロンプトの品質を最適化
非決定性の課題を改善 1. トレーシングによって入力と出力を追跡し、特定の出力が生成された理由を分析 2. 評価によって非決定的な応答を 「許容範囲内」か「問題あり」かを判断 3. フィードバックからモデルやプロンプトを継続的に改善し、出力の非決定性を最 小化 👉
モデル、プロンプトの継続的な改善で出力の品質を安定させる ©BLUEISH 2025. All rights reserved.
©BLUEISH 2025. All rights reserved. その他特徴 ❏ フルマネージド・セルフホストどちらも対応 ❏ 個人利用であれば十分な無料枠がある
❏ LangChainと併用すると効率的に開発できる (LangChainを使用していなくても利用可能)
©BLUEISH 2025. All rights reserved. プラン比較
©BLUEISH 2025. All rights reserved. LangSmithとLangfuseの簡単な比較 引用: LangChainから使用する LangSmithとLangfuseの詳細比(https://zenn.dev/aidemy/articles/13ceca39b0ea6c) ※
Enterpriseプラン (最上位プラン )に加入することでセルフホストも可能 どちらもLLMアプリケーションの開発・運用・改善を支援するツール
©BLUEISH 2025. All rights reserved. LangSmithを試してみる Amazon Bedrockを用いてチャット機能を構築し、LangSmithを導入 トレーシングとプロンプト管理を試します ※PythonとLangChainで記述しています(LangChainを利用していなくても導入できます)
©BLUEISH 2025. All rights reserved. LangSmithを試してみる Amazon Bedrockに対応したLangChainのライブラリをインストール
©BLUEISH 2025. All rights reserved. LangSmithを試してみる 簡易的なチャット機能を構築
©BLUEISH 2025. All rights reserved. LangSmithを試してみる LangSmithを導入。 HPにアクセスしサインアップ
©BLUEISH 2025. All rights reserved. LangSmithを試してみる APIキーを発行
©BLUEISH 2025. All rights reserved. LangSmithを試してみる 環境変数をアプリケーションに設定
©BLUEISH 2025. All rights reserved. LangSmithを試してみる 以上、環境変数を設定するだけでLangSmithが使えるようになる
©BLUEISH 2025. All rights reserved. トレース チャットでやり取りをして、トレースされているか確認する
©BLUEISH 2025. All rights reserved. トレース 環境変数で設定したプロジェクト単位で監視
©BLUEISH 2025. All rights reserved. トレース 個々のやり取りのトレースが記録
©BLUEISH 2025. All rights reserved. トレース 入力プロンプトと生成された出力、メタデータ
©BLUEISH 2025. All rights reserved. トレース アプリ全体としてモニタリング
©BLUEISH 2025. All rights reserved. トレース 可視化して確認できる
©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプト管理を使ってみる
©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプトを作成。想定する変数、モデルを指定してプロンプトの出力をテスト
©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプトテンプレートを保存。LangSmith上で管理できる。
プロンプトの変更をコミットとしてバージョン管理 ©BLUEISH 2025. All rights reserved. プロンプト管理
©BLUEISH 2025. All rights reserved. プロンプト管理 保存したプロンプトはアプリケーションに簡単に呼び出せる
©BLUEISH 2025. All rights reserved. まとめ LangSmithはLLMアプリケーションの開発・運用・改善を支援し、簡単に導入できること がわかった