オブザーバビリティとエージェント型AI - データ探索から答えへ -

2025.12 オブザーバビリティとエージェント型 AI - データ探索から答えへ - Miki Matsumoto Senior Support
Engineer

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 2 About me •
ClickHouseの日本人社員第１号 • 現在はSAやTechnical Supportをメインに担当 • 最近の10年+、主に大規模で分散システムの SREやプロフェッショナルサービスを中心に活動

ClickHouse の紹介

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 4 ClickHouse とは? ClickHouseは、
オープンソースの列指向 OLAP データベースです。膨大なデータを超高速で分析するために設計されています。簡単にスケール可能データを超高速で処理できる高効率なストレージ SQLを流暢に扱える

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 5 ClickHouse 世界で最も人気のある分析データベース 2009
プロトタイプ 2016 オープンソース 2021 ClickHouse Inc. 2022 ClickHouse Cloud DBEngines における分析OSSデータベースランキング #1 GitHubスター数 44,500 　　　　　　　以上 Cloudを利用している企業数 2,000 　　　　　　　　　　　以上 2024 AWS Tokyo Regionオープン 2025 GCP Tokyo Regionオープン

6 ClickHouse の勢い ClickHouse オープンソース ➔ 44.5万以上のスター ➔ 1,600以上のコントリビュータ
➔ 7,000以上のフォーク世界で最も人気のある分析データベース 8年経ったけれど、まだ始まったばかり ➔ 1万人以上のSlackメンバー ➔ 25万人以上のコミュニティメンバー ➔ 約500名のアクティブなコントリビュータ

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 7 ClickHouse Cloud の利用状況の推移
わずか３年で2,000超の企業が利用 Tesla

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 8 ClickHouse 社が開発しているメジャーな OSSは？
スター数製品概要 ClickHouse 44.5K リアルタイムDB/DWH LibreChat 32.2K LLMのチャットプラットフォーム HyperDX 9.1K オブザーバビリティプラットフォームのUI + 分析基盤 PeerDB 2.8K DB間のリアルタイム CDC パイプライン chDB 2.5K インプロセス用の ClickHouse

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 9 Observability にClickHouse を利用している企業
& many more OpenAI Tesla

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 11 • どんなスキーマでも、 ClickHouse
上に数秒でデプロイ • フロントエンドからインフラまで、オブザーバビリティ向けに設計 • ClickHouse の性能を最大限引き出す最適化 • OpenTelemetry ネイティブ、完全オープンソース ClickStack 高性能なオープンソースの observability stack

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 12 ClickStack のアーキテクチャ User
Kubernetes Cluster Node ClickHouse App container Container logs & Kubernetes metrics OTel Daemonset OTel SDK OTel collector deployment Kubernetes API HyperDX

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 16 AIエージェントの基盤に ClickHouse を採用する利用
• ドキュメントはすべて公開され、ベースモデルにすでに学習済み ◦ 追加分のトークンコストはゼロ • 基本的な説明や前提知識をコンテキストに含める必要が減る ◦ トークンが減り、精度向上・コスト削減につながる • モデルは、独自方言ではなく標準 SQL の生成が非常に得意 ˮContext Rot: How Increasing Input Tokens Impacts LLM Performanceˮ research.trychroma.com/context-rot SQL の理解公式ドキュメント Github Issues ClickHouseブログ LLM Model ClickHouse コンテキスト

17 100 PB ストレージサイズ社内のオブザーバビリティ基盤で検証 API LibreChat MCP SREs Observability
store 500 兆レコード 6ヶ月データ保持期間 LogHouse AI エージェントのアーキテクチャ https://clickhouse.com/blog/scaling-observability- beyond-100pb-wide-events-replacing-otel

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 18 いくつかの課題同じ質問を繰り返しても少しずつ異なるク
エリを生成する。探索型の分析を続ける中で、その小さな違いが積み重なり、エージェントが全く別の方向へ探索を進めてしまう。基盤モデルはシステムプロンプトで包むと “おしゃべりˮになりやすく、広い検索範囲から無理に問題を探そうとします。その結果、存在しない問題を作り出したり、軽微な事象を過大評価したりしてしまいます。クエリのジッター（揺らぎ）エージェントの過剰探索 LogHouse での経験をもとに

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 19 クエリのジッター（揺らぎ） • モデルの知性が高くても、生成されるクエ
リに “ジッター（揺らぎ） ˮ が発生 • Temperature(温度)を低く設定しても、同じプロンプトに対してわずかに異なるクエリが返ってくる同じプロンプトでも結果が変わる

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 20 クエリのジッター「plum-qa-31 の最近のエラーを確認して」のクエリジッター
SELECT toStartOfMinute(event_time) as minute, errorCodeToName(code) as error_name, count() as occurrences FROM loghouse.merge_error_log WHERE spoken_name = 'plum-qa-31' AND event_time >= now() - INTERVAL 2 HOUR GROUP BY minute, error_name ORDER BY minute DESC, occurrences DESC SELECT toStartOfHour(event_time) as hour, level, count() as log_count FROM otel.server_text_log_0 WHERE Namespace = 'ns-plum-qa-31' AND EventDate >= today() AND event_time >= now() - INTERVAL 6 HOUR AND SeverityText IN ('ERROR', 'FATAL') GROUP BY hour, level ORDER BY hour DESC

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 21 クエリのジッターの解決方法 MCP 用に専用関数を提供する
• クエリをモデルにそのまま作らせる方法は、遅い・不安定・誤った内容を出しやすい • 専用の機能（ツール）を用意して使わせる方がはるかに安定する • MCP 経由で公開 • 一般的な運用手順（Playbook）に沿って設計 • 必要に応じて自由な SQL を使った詳細分析も可能 getExceptionsHistogram(), getK8sReadinessEvents(), getQueryLatencies(), getCPUWaitTimeseries(), getMergesRunning(), getSelectedBytesTimeseries(), getInsertedRowsTimeseries(), getPageCacheHitRateTimeseries(), getAutoscalerEvents(), getServerVersionDistribution() …

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 22 エージェントが “余計な問題 ˮを探してしまう課題
基盤モデルをシステムプロンプトで包むと、どうしても “おしゃべりˮ になりがちで、広い検索空間の中から必ず何か問題を見つけようとしてしまう。そのため、実際には存在しない問題を捏造したり、たいしたことのない事象を過大評価したりすることがある。エージェントの探索範囲が広すぎるため、本質的ではないシグナルを延々と追い続けてしまうことも起きる。 • より小さく、焦点を絞ったコンテキストウィンドウを使う • 汎用エージェントではなく、特定の問題に特化したサブエージェント（例：メモリ問題専門）を用意 • サブエージェントには、関連するプレイブックを提供（コンテキストに含める、または RAG で補強する形） • エージェントに重大度（Severity）判定をさせ、軽微なものは破棄する問題解決策 - 検索範囲を絞る AI AGENT Agentic SRE ORCHESTRATOR AI AGENT Agentic SRE AI AGENT Agentic SRE

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 24 今後の展開エージェントをオブザーバビリティワークフローへ拡張 •
ClickStack におけるエージェント主導のインシデント調査 ◦ 監視 UI に組み込まれたエージェントが、ログ・メトリクス・トレースを横断して関連シグナルを発見し、調査を開始する。 • アラート起点のインシデント調査 ◦ エージェントがアラートを受けて調査を開始し、必要に応じてプレイブックを活用しながら、あらかじめ定義された探索パスに沿って問題を深掘りする。 • Human-in-the-loop ワークフロー ◦ エンジニアがエージェントの分析内容をガイドし、検証することで、精度を保ちながら、検知から解決までの時間を大幅に短縮。

オブザーバビリティとエージェント型AI - データ探索から答えへ -

オブザーバビリティとエージェント型AI - データ探索から答えへ -

Miki Matsumoto

More Decks by Miki Matsumoto

Featured

Transcript

2025.12 オブザーバビリティとエージェント型 AI - データ探索から答えへ - Miki Matsumoto Senior Support

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 2 About me •

ClickHouse の紹介

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 4 ClickHouse とは? ClickHouseは、

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 5 ClickHouse 世界で最も人気のある分析データベース 2009

6 ClickHouse の勢い ClickHouse オープンソース ➔ 44.5万以上のスター ➔ 1,600以上のコントリビュータ

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 7 ClickHouse Cloud の利用状況の推移

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 8 ClickHouse 社が開発しているメジャーな OSSは？

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 9 Observability にClickHouse を利用している企業

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 10

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 11 • どんなスキーマでも、 ClickHouse

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 12 ClickStack のアーキテクチャ User

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 13 DEMO

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 14 データ探索から答えへ

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 15 AIエージェントは、優秀なSREになれるのか？

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 16 AIエージェントの基盤に ClickHouse を採用する利用

17 100 PB ストレージサイズ社内のオブザーバビリティ基盤で検証 API LibreChat MCP SREs Observability

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 18 いくつかの課題同じ質問を繰り返しても少しずつ異なるク

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 19 クエリのジッター（揺らぎ） • モデルの知性が高くても、生成されるクエ

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 20 クエリのジッター「plum-qa-31 の最近のエラーを確認して」のクエリジッター

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 21 クエリのジッターの解決方法 MCP 用に専用関数を提供する

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 22 エージェントが “余計な問題 ˮを探してしまう課題

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 23 DEMO

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 24 今後の展開エージェントをオブザーバビリティワークフローへ拡張 •

©2025 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 25 Thanks