Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
制約下の医療LLM Observability 〜セキュアなデータ活用と専門家による改善サイク...
Search
KAKEHASHI
PRO
October 26, 2025
Technology
630
2
Share
制約下の医療LLM Observability 〜セキュアなデータ活用と専門家による改善サイクルの実現〜
https://o11ycon.jp/
Observability Conference Tokyo 2025
での登壇資料です
KAKEHASHI
PRO
October 26, 2025
More Decks by KAKEHASHI
See All by KAKEHASHI
変化の激しい時代をゴキゲンに生き抜くために 〜ストレスマネジメントのススメ〜
kakehashi
PRO
1
410
「SaaSの次の時代」に重要性を増すステークホルダーマネジメントの要諦 ~解像度を圧倒的に高めPdMの価値を最大化させる方法~
kakehashi
PRO
3
3.4k
プロダクトを育てるように生成AIによる開発プロセスを育てよう
kakehashi
PRO
2
1.7k
チームのモメンタムに投資せよ! 不確実性と共存しながら勢いを生み出す3つの実践
kakehashi
PRO
1
250
FAXが現役の業界でマルチモーダルAIプロダクトを作る
kakehashi
PRO
1
190
EMからVPoEを経てCTOへ:マネジメントキャリアパスにおける葛藤と成長
kakehashi
PRO
9
2.6k
器用貧乏が強みになるまで ~「なんでもやる」が導いたエンジニアとしての現在地~
kakehashi
PRO
6
1.2k
AIで「ふとした疑問」を即座に検証する 〜定量で圧倒するN1理解〜
kakehashi
PRO
3
1.2k
生成AIと余白 〜開発スピードが向上した今、何に向き合う?〜
kakehashi
PRO
1
500
Other Decks in Technology
See All in Technology
需要創出(Chatwork)×供給(BPaaS) フライホイールとMoat 実行能力の最適配置とAI戦略
kubell_hr
0
1.6k
AI バイブコーティングでキーボード不要?!
samakada
0
670
Agents CLI と Gemini Enterprise Agent Platform で マルチエージェント開発が楽しくなる!
kaz1437
0
200
データ定義の混乱と戦う 〜 管理会計と財務会計 〜
wonohe
0
170
小さいVue.jsを30分で作る
hal_spidernight
0
110
AI時代の品質はテストプロセスの作り直し #scrumniigata
kyonmm
PRO
3
560
ファインディの事業拡大を支える 拡張可能なデータ基盤へのリアーキテクチャ
hiracky16
0
680
No Types Needed, Just Callable Method Check
dak2
1
2.7k
Digital Independence: Why, When and How
wannesrams
0
210
国内外の生成AIセキュリティの最新動向 & AIガードレール製品「chakoshi」のご紹介 / Latest Trends in Generative AI Security (Domestic & International) & Introduction to AI Guardrail Product "chakoshi"
nttcom
4
1.6k
自動テストだけで リリース判断できるチームへ - 鍵はテストの量ではなくリリース判断基準の再設計にあった / Redesigning Release Criteria for Lightweight Releases
ewa
4
2.3k
AIはハッカーを減らすのか、増やすのか?──現役ホワイトハッカーから見るAI時代のリアル【MEGU-Meet】
cscengineer
PRO
0
240
Featured
See All Featured
SEO for Brand Visibility & Recognition
aleyda
0
4.5k
Design in an AI World
tapps
1
200
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.8k
WCS-LA-2024
lcolladotor
0
560
The browser strikes back
jonoalderson
0
1k
Typedesign – Prime Four
hannesfritz
42
3k
Site-Speed That Sticks
csswizardry
13
1.2k
Claude Code のすすめ
schroneko
67
220k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
AI: The stuff that nobody shows you
jnunemaker
PRO
6
610
Color Theory Basics | Prateek | Gurzu
gurzu
0
300
The Illustrated Guide to Node.js - THAT Conference 2024
reverentgeek
1
340
Transcript
制約下の医療LLMオブザーバビリティ 〜セキュアなデータ活用と 専門家による改善サイクルの実現〜 Observability Conference 2025 2025.10.27 株式会社カケハシ 保坂 桂佑
自己紹介 保坂 桂佑 (@free_skier) 株式会社カケハシ データサイエンティスト データ分析コンサル → リクルートでDS/MLエンジニア/EM →
カケハシ 著書『Kaggleで勝つデータ分析の技術』 (共著) LLMを活用した機能開発において、AIワークフロー の品質担保や改善を担当しています 2 / 21
3 / 21
4 / 21
5 / 21
カケハシの生成AI活用における取り組み領域 6 / 21
なぜ医療LLMのオブザーバビリティが難しいのか? 相反する2つの要求を同時に満たす必要があるため 厳格なデータ保護 個人情報保護法、医療情報ガイドラインへの準拠 マルチモーダルなデータ(音声・画像等)の保護は更に高難度 高い出力品質の要求 医療においては患者さんの健康に影響がないよう、何よりも正確性が重視される ハルシネーション(誤った回答)のリスクを低減する必要がある 継続的な監視と改善活動が不可欠 7
/ 21
本日の内容 開発運用中の医療LLMシステムにおいて、どのようにオブザーバビリティを確保したか、どのよう にドメインエキスパートとともに改善サイクルを回せるようにしたかをご紹介します。 実現したいこと どのように実現したか ドメインエキスパートによる改善サイクル 8 / 21
システム構成 本番環境 LLMアプリケーションが稼働 調査環境(セキュア) セキュアブラウザー+VPN経由でアク セス Databricksは調査分析に必要な機能 がオールインワン 秘匿性の高いデータが必要な場面で使 用
モニタリング環境(Datadog) 定期モニタリング、分析を実施 プロトタイピング環境(Dify) 隔離環境外にあるため、本番データは 直接扱えない 9 / 21
実現したいこと 医療LLMシステムにおいて、以下の3つを両立させたい データ保護 機密情報は高セキュリティ環境から出さない セキュアブラウザー経由でのみデータにアクセス LLMの挙動監視 機密性の低い情報: トレース情報として取得し、モニタリング環境で監視 機密性の高い情報: LLM出力やマルチモーダルデータを調査環境で確認
本番相当の環境での検証 本番相当の環境でプロンプト検証、ワークフロー検証ができる ドメインエキスパートが自律的に改善サイクルを回せる 10 / 21
実現方法 以下の3つの機能を通じて実現 トレース情報の取得、連携 セキュア環境へのデータ連携 本番相当の環境でのワークフロー検証 11 / 21
トレース情報の取得、連携 LLMフレームワークに依存しない、自前の トレース情報収集 自前でトレース情報を構築して出力する仕 組みを実装 機密性の低い情報(レスポンスタイム、ト ークン数等)を収集 12 / 21
トレース情報の取得、連携(詳細) 13 / 21
セキュア環境へのデータ連 携 本番DBに影響を与えず、セキュアにデータ を連携 注意すべき点 本番DBに影響が出ない形でデータ連携 コストを意識 14 / 21
セキュア環境へのデータ連 携(詳細) DatabricksのLakehouse Federationを 使用 Databricksの権限管理の元で本番環境のDB にアクセスできる仕組み ホットスタンバイの利用により本番影響を 回避 夜間バッチで前日までのデータを同期
15 / 21
本番相当の環境でのワーク フロー検証 Difyはグラフィカルな画面でプロンプト・ ワークフローを構築できる しかし、Difyは隔離環境の外にあるた め、データを入れられない 本番環境とは挙動を厳密に一致させるこ とができない 最終的には本番環境相当のワークフロー で検証を行いたい
16 / 21
本番相当の環境でのワーク フロー検証(詳細) Databricksから本番環境のワークフロ ー実行APIをコールできるように AWS VPC Endpoint + Private Linkに
より実現 スループット制限をかけて本番環境に影 響が出ないように 17 / 21
ドメインエキスパートによる改善サイクル セキュリティを確保しつつ、生成AIサービス提供において必要な情報が参照できるように Dify, Databricks環境を使い分けつつ、エンジニア・ドメインエキスパートが協力して改善を実 施 18 / 21
課題と今後の展望 精度劣化の自動検知・アラート プロトタイピング環境と本番Workflowの乖離を減らしたい 19 / 21
まとめ 医療LLMのオブザーバビリティは難しい 厳格なデータ保護 高い出力品質の要求 データを保護しつつ、LLMの挙動監視と本番相当の環境での検証を実現したい 以下の3つの機能を通じて実現 トレース情報の取得、連携 セキュア環境へのデータ連携 本番相当の環境でのワークフロー検証 エンジニア・ドメインエキスパートが協力して改善を実施できるようになった
20 / 21
21 / 21