Upgrade to Pro — share decks privately, control downloads, hide ads and more …

レバレジーズのLangfuse活用事例

 レバレジーズのLangfuse活用事例

2025/11/29に開催された「Data Engineering Summit 前夜祭」の登壇資料です。

https://langfuse.connpass.com/event/372733/

Avatar for Tech Leverages

Tech Leverages

November 25, 2025
Tweet

More Decks by Tech Leverages

Other Decks in Technology

Transcript

  1. 3 © 2025 Leverages Co., Ltd. 苑田 朝彰 普段の業務内容 •

    AI エージェント開発(Google ADK, Strands Agent) • 社内AI推進(AI駆動開発、Agent開発) • クラウド(AWS, Google Cloud) 資格 • AWS Community Builders(ML) • 甲賀流忍者検定(中級) • 2024 AWS Top Engineers(前職) 趣味 • 月一で面白いことをするのにハマってます ◦ Spartanレース ◦ 100kmウォーキング ◦ 無人島かくれんぼ ◦ 滝行 SNS • https://x.com/sonoda_mj • https://zenn.dev/tomomj • https://note.com/sonoda_mj Tomotada Sonoda システム本部/テクノロジー戦略室/AIMLチーム 自己紹介
  2. 会社概要 所在地 本社:渋⾕スクランブルスクエア 24 ‧ 25階 設⽴ 2005年 従業員数 正規:3,343名(2025年4⽉時点) 

    資本⾦ 5,000万円 年商 1428億円(2024年度) 事業内容 ⾃社メディア事業‧⼈材関連事業‧システムエンジニアリング 事業‧M&Aコンサルティング事業‧ ASP/ SaaS/クラウド関連 事業
  3. 15 © 2025 Leverages Co., Ltd. Langfuseを中心としたPDCAサイクル トレース プロンプト管理 プロンプトを変更する

    何が起きてるかみる Good/Badを評価する 評価 Agentを 動かす Langfuse 4部署が使用していて、合計で12プロジェクトが導入している!
  4. 24 © 2025 Leverages Co., Ltd. マルチターンの評価 マルチターンは文脈考慮が必要であり、シングルターンに比べ評価難度が高くなります。 Langfuseの全ターントレースを用いてマルチターン評価パイプラインを構築予定です。 こんにちは!

    自己紹介をお願いします! 苑田です! 自己紹介をお願いします! さっき言ったが?? ・同じ質問をしていないか ・会話内容を忘れていないか ・ロールに沿った質問をしているか などなど
  5. 26 © 2025 Leverages Co., Ltd. まとめ 1. LangfuseにTraceを送ることで、Agentの挙動が確認できる。 2.

    Langfuseのプロンプト管理を使用することで、エンジニアの工数を削減。 3. LangfuseのDatasetを活用し、評価を簡単に実施。