Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Langsmith入門 トレーシングとプロンプト管理を試す
Search
ttnyt8701
February 26, 2025
Programming
1
72
Langsmith入門 トレーシングとプロンプト管理を試す
【AWS活用 AI/ML/LLM #4】機械学習/大規模言語モデルのモニタリング、保守、セキュリティ
https://blueish.connpass.com/event/346463/
ttnyt8701
February 26, 2025
Tweet
Share
More Decks by ttnyt8701
See All by ttnyt8701
Amazon Bedrock LLM as a Judgeを試す
ttnyt8701
0
3
Amazon Sagemaker Jump Startを用いて爆速でモデルを作成してみる
ttnyt8701
2
51
Amazon SageMaker Lakehouseでデータのサイロ化による課題を解決する
ttnyt8701
1
29
Amazon Bedrock Custom model importを試してみる
ttnyt8701
2
78
Prompt Cachingは本当に効果的なのか検証してみた.pdf
ttnyt8701
1
650
Other Decks in Programming
See All in Programming
MCP調べてみました! / Exploring MCP
uhzz
2
2.2k
PHPのガベージコレクションを深掘りしよう
rinchoku
0
260
Devinのメモリ活用の学びを自社サービスにどう組み込むか?
itarutomy
0
2.1k
Being an ethical software engineer
xgouchet
PRO
0
210
リアクティブシステムの変遷から理解するalien-signals / Learning alien-signals from the evolution of reactive systems
yamanoku
3
1.2k
これだけは知っておきたいクラス設計の基礎知識 version 2
masuda220
PRO
24
6.1k
AHC045_解説
shun_pi
0
470
Rollupのビルド時間高速化によるプレビュー表示速度改善とバンドラとASTを駆使したプロダクト開発の難しさ
plaidtech
PRO
1
160
AWS で実現する安全な AI エージェントの作り方 〜 Bedrock Engineer の実装例を添えて 〜 / how-to-build-secure-ai-agents
gawa
8
710
パスキーのすべて / 20250324 iddance Lesson.5
kuralab
0
150
[NG India] Event-Based State Management with NgRx SignalStore
markostanimirovic
1
110
php-fpm がリクエスト処理する仕組みを追う / Tracing-How-php-fpm-Handles-Requests
shin1x1
5
2.9k
Featured
See All Featured
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
31
1.1k
[RailsConf 2023] Rails as a piece of cake
palkan
54
5.4k
How GitHub (no longer) Works
holman
314
140k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
52
2.4k
A better future with KSS
kneath
239
17k
Mobile First: as difficult as doing things right
swwweet
223
9.6k
Site-Speed That Sticks
csswizardry
5
480
The Invisible Side of Design
smashingmag
299
50k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.3k
Documentation Writing (for coders)
carmenintech
69
4.7k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
The World Runs on Bad Software
bkeepers
PRO
67
11k
Transcript
LangSmith入門 トレーシング・プロンプト管理を試す 立野 祐太 2025.02.27 ©BLUEISH 2025. All rights reserved.
立野 祐太 Yuta Tateno 普段はGo、GCPを用いたWEB開発をしています。 バックエンドエンジニア 自己紹介 ©BLUEISH 2024. All
rights reserved.
©BLUEISH 2025. All rights reserved. 目的 LangSmithの機能・導入のイメージを掴んでもらう
©BLUEISH 2025. All rights reserved. 対象者 ❏ LLMアプリ開発の初心者の方 ❏ LangSmithや類似ツールを使ったことがない人
©BLUEISH 2025. All rights reserved. 目次 1. LangSmithについて a. 主な機能
b. なぜ必要なのか c. その他特徴 d. プラン比較 e. Langfuseとの比較 2. LangSmithを試してみる a. トレース b. プロンプト管理 3. まとめ
©BLUEISH 2025. All rights reserved. LLMアプリケーション開発での課題 LLMでは以下の特性があります ❏ 非決定性である ❏
同じ入力でも毎回異なる出力を返すことがある ❏ 出力の正確性、自然さ、一貫性 が保証されない ❏ ハルシネーションを起こす 一貫した応答を求められるアプリケーションでは、これらは問題となります 👉 LangSmithで改善しよう
©BLUEISH 2025. All rights reserved. 🦜⚒LangSmithとは LLMアプリケーションの開発・運用・改善を支援するツール
©BLUEISH 2025. All rights reserved. 主な機能 ❏ トレーシング LLMのプロンプト、出力、実行ステップ、エラーなどリクエストの詳細を追跡 ❏
モニタリング 応答時間、エラー率、リクエスト数 などシステム全体の健康状態を監視 ❏ 監視 トレーシング・モニタリングからシステムの内部状態を可視化し異常の特定を支援 ❏ 自動評価 事前に設定した 評価指標とモデルの出力を自動で比較して評価 ❏ キューの注釈 人間のフィードバックを収集し、モデルの出力品質を評価・改善 ❏ プロンプト管理 プロンプトのバージョン管理や A/B テストを通じてプロンプトの品質を最適化
非決定性の課題を改善 1. トレーシングによって入力と出力を追跡し、特定の出力が生成された理由を分析 2. 評価によって非決定的な応答を 「許容範囲内」か「問題あり」かを判断 3. フィードバックからモデルやプロンプトを継続的に改善し、出力の非決定性を最 小化 👉
モデル、プロンプトの継続的な改善で出力の品質を安定させる ©BLUEISH 2025. All rights reserved.
©BLUEISH 2025. All rights reserved. その他特徴 ❏ フルマネージド・セルフホストどちらも対応 ❏ 個人利用であれば十分な無料枠がある
❏ LangChainと併用すると効率的に開発できる (LangChainを使用していなくても利用可能)
©BLUEISH 2025. All rights reserved. プラン比較
©BLUEISH 2025. All rights reserved. LangSmithとLangfuseの簡単な比較 引用: LangChainから使用する LangSmithとLangfuseの詳細比(https://zenn.dev/aidemy/articles/13ceca39b0ea6c) ※
Enterpriseプラン (最上位プラン )に加入することでセルフホストも可能 どちらもLLMアプリケーションの開発・運用・改善を支援するツール
©BLUEISH 2025. All rights reserved. LangSmithを試してみる Amazon Bedrockを用いてチャット機能を構築し、LangSmithを導入 トレーシングとプロンプト管理を試します ※PythonとLangChainで記述しています(LangChainを利用していなくても導入できます)
©BLUEISH 2025. All rights reserved. LangSmithを試してみる Amazon Bedrockに対応したLangChainのライブラリをインストール
©BLUEISH 2025. All rights reserved. LangSmithを試してみる 簡易的なチャット機能を構築
©BLUEISH 2025. All rights reserved. LangSmithを試してみる LangSmithを導入。 HPにアクセスしサインアップ
©BLUEISH 2025. All rights reserved. LangSmithを試してみる APIキーを発行
©BLUEISH 2025. All rights reserved. LangSmithを試してみる 環境変数をアプリケーションに設定
©BLUEISH 2025. All rights reserved. LangSmithを試してみる 以上、環境変数を設定するだけでLangSmithが使えるようになる
©BLUEISH 2025. All rights reserved. トレース チャットでやり取りをして、トレースされているか確認する
©BLUEISH 2025. All rights reserved. トレース 環境変数で設定したプロジェクト単位で監視
©BLUEISH 2025. All rights reserved. トレース 個々のやり取りのトレースが記録
©BLUEISH 2025. All rights reserved. トレース 入力プロンプトと生成された出力、メタデータ
©BLUEISH 2025. All rights reserved. トレース アプリ全体としてモニタリング
©BLUEISH 2025. All rights reserved. トレース 可視化して確認できる
©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプト管理を使ってみる
©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプトを作成。想定する変数、モデルを指定してプロンプトの出力をテスト
©BLUEISH 2025. All rights reserved. プロンプト管理 プロンプトテンプレートを保存。LangSmith上で管理できる。
プロンプトの変更をコミットとしてバージョン管理 ©BLUEISH 2025. All rights reserved. プロンプト管理
©BLUEISH 2025. All rights reserved. プロンプト管理 保存したプロンプトはアプリケーションに簡単に呼び出せる
©BLUEISH 2025. All rights reserved. まとめ LangSmithはLLMアプリケーションの開発・運用・改善を支援し、簡単に導入できること がわかった