Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Langsmith入門 トレーシングとプロンプト管理を試す
Search
ttnyt8701
February 26, 2025
Programming
1
76
Langsmith入門 トレーシングとプロンプト管理を試す
【AWS活用 AI/ML/LLM #4】機械学習/大規模言語モデルのモニタリング、保守、セキュリティ
https://blueish.connpass.com/event/346463/
ttnyt8701
February 26, 2025
Tweet
Share
More Decks by ttnyt8701
See All by ttnyt8701
Vertex AI Agent Builderとは?
ttnyt8701
2
72
A2A(Agent2Agent )とは? 基礎・概要
ttnyt8701
0
82
Amazon Bedrock LLM as a Judgeを試す
ttnyt8701
0
11
Amazon Sagemaker Jump Startを用いて爆速でモデルを作成してみる
ttnyt8701
2
53
Amazon SageMaker Lakehouseでデータのサイロ化による課題を解決する
ttnyt8701
1
29
Amazon Bedrock Custom model importを試してみる
ttnyt8701
2
79
Prompt Cachingは本当に効果的なのか検証してみた.pdf
ttnyt8701
1
650
Other Decks in Programming
See All in Programming
The Implementations of Advanced LR Parser Algorithm
junk0612
1
1.3k
Vibe Coding の話をしよう
schroneko
13
3.6k
ウォンテッドリーの「ココロオドル」モバイル開発 / Wantedly's "kokoro odoru" mobile development
kubode
1
260
今話題のMCPサーバーをFastAPIでサッと作ってみた
yuukis
0
110
Make Parsers Compatible Using Automata Learning
makenowjust
2
6.9k
The Nature of Complexity in John Ousterhout’s Philosophy of Software Design
philipschwarz
PRO
0
160
UMAPをざっくりと理解 / Overview of UMAP
kaityo256
PRO
3
1.4k
Thank you <💅>, What's the Next?
ahoxa
1
590
スモールスタートで始めるためのLambda×モノリス(Lambdalith)
akihisaikeda
2
340
SwiftDataのカスタムデータストアを試してみた
1mash0
0
140
GitHub Copilot for Azureを使い倒したい
ymd65536
1
310
Creating Awesome Change in SmartNews! En
martin_lover
0
110
Featured
See All Featured
Statistics for Hackers
jakevdp
798
220k
Designing for Performance
lara
608
69k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Java REST API Framework Comparison - PWX 2021
mraible
31
8.5k
Designing Experiences People Love
moore
142
24k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
45
7.2k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Become a Pro
speakerdeck
PRO
28
5.3k
We Have a Design System, Now What?
morganepeng
52
7.5k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.7k
Into the Great Unknown - MozCon
thekraken
38
1.7k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
105
19k
Transcript
LangSmith入門 トレーシング・プロンプト管理を試す 立野 祐太 2025.02.27 ©BLUEISH 2025. All rights reserved.
立野 祐太 Yuta Tateno 普段はGo、GCPを用いたWEB開発をしています。 バックエンドエンジニア 自己紹介 ©BLUEISH 2024. All
rights reserved.
©BLUEISH 2025. All rights reserved. 目的 LangSmithの機能・導入のイメージを掴んでもらう
©BLUEISH 2025. All rights reserved. 対象者 ❏ LLMアプリ開発の初心者の方 ❏ LangSmithや類似ツールを使ったことがない人
©BLUEISH 2025. All rights reserved. 目次 1. LangSmithについて a. 主な機能
b. なぜ必要なのか c. その他特徴 d. プラン比較 e. Langfuseとの比較 2. LangSmithを試してみる a. トレース b. プロンプト管理 3. まとめ
©BLUEISH 2025. All rights reserved. LLMアプリケーション開発での課題 LLMでは以下の特性があります ❏ 非決定性である ❏
同じ入力でも毎回異なる出力を返すことがある ❏ 出力の正確性、自然さ、一貫性 が保証されない ❏ ハルシネーションを起こす 一貫した応答を求められるアプリケーションでは、これらは問題となります 👉 LangSmithで改善しよう
©BLUEISH 2025. All rights reserved. 🦜⚒LangSmithとは LLMアプリケーションの開発・運用・改善を支援するツール
©BLUEISH 2025. All rights reserved. 主な機能 ❏ トレーシング LLMのプロンプト、出力、実行ステップ、エラーなどリクエストの詳細を追跡 ❏
モニタリング 応答時間、エラー率、リクエスト数 などシステム全体の健康状態を監視 ❏ 監視 トレーシング・モニタリングからシステムの内部状態を可視化し異常の特定を支援 ❏ 自動評価 事前に設定した 評価指標とモデルの出力を自動で比較して評価 ❏ キューの注釈 人間のフィードバックを収集し、モデルの出力品質を評価・改善 ❏ プロンプト管理 プロンプトのバージョン管理や A/B テストを通じてプロンプトの品質を最適化
非決定性の課題を改善 1. トレーシングによって入力と出力を追跡し、特定の出力が生成された理由を分析 2. 評価によって非決定的な応答を 「許容範囲内」か「問題あり」かを判断 3. フィードバックからモデルやプロンプトを継続的に改善し、出力の非決定性を最 小化 👉
モデル、プロンプトの継続的な改善で出力の品質を安定させる ©BLUEISH 2025. All rights reserved.
©BLUEISH 2025. All rights reserved. その他特徴 ❏ フルマネージド・セルフホストどちらも対応 ❏ 個人利用であれば十分な無料枠がある
❏ LangChainと併用すると効率的に開発できる (LangChainを使用していなくても利用可能)
©BLUEISH 2025. All rights reserved. プラン比較
©BLUEISH 2025. All rights reserved. LangSmithとLangfuseの簡単な比較 引用: LangChainから使用する LangSmithとLangfuseの詳細比(https://zenn.dev/aidemy/articles/13ceca39b0ea6c) ※
Enterpriseプラン (最上位プラン )に加入することでセルフホストも可能 どちらもLLMアプリケーションの開発・運用・改善を支援するツール
©BLUEISH 2025. All rights reserved. LangSmithを試してみる Amazon Bedrockを用いてチャット機能を構築し、LangSmithを導入 トレーシングとプロンプト管理を試します ※PythonとLangChainで記述しています(LangChainを利用していなくても導入できます)
©BLUEISH 2025. All rights reserved. LangSmithを試してみる Amazon Bedrockに対応したLangChainのライブラリをインストール
©BLUEISH 2025. All rights reserved. LangSmithを試してみる 簡易的なチャット機能を構築
©BLUEISH 2025. All rights reserved. LangSmithを試してみる LangSmithを導入。 HPにアクセスしサインアップ
©BLUEISH 2025. All rights reserved. LangSmithを試してみる APIキーを発行
©BLUEISH 2025. All rights reserved. LangSmithを試してみる 環境変数をアプリケーションに設定
©BLUEISH 2025. All rights reserved. LangSmithを試してみる 以上、環境変数を設定するだけでLangSmithが使えるようになる
©BLUEISH 2025. All rights reserved. トレース チャットでやり取りをして、トレースされているか確認する
©BLUEISH 2025. All rights reserved. トレース 環境変数で設定したプロジェクト単位で監視
©BLUEISH 2025. All rights reserved. トレース 個々のやり取りのトレースが記録
©BLUEISH 2025. All rights reserved. トレース 入力プロンプトと生成された出力、メタデータ
©BLUEISH 2025. All rights reserved. トレース アプリ全体としてモニタリング
©BLUEISH 2025. All rights reserved. トレース 可視化して確認できる
©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプト管理を使ってみる
©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプトを作成。想定する変数、モデルを指定してプロンプトの出力をテスト
©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプトテンプレートを保存。LangSmith上で管理できる。
プロンプトの変更をコミットとしてバージョン管理 ©BLUEISH 2025. All rights reserved. プロンプト管理
©BLUEISH 2025. All rights reserved. プロンプト管理 保存したプロンプトはアプリケーションに簡単に呼び出せる
©BLUEISH 2025. All rights reserved. まとめ LangSmithはLLMアプリケーションの開発・運用・改善を支援し、簡単に導入できること がわかった