Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SQLによるオブザーバビリティの進化とClickHouseの実力
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Miki Matsumoto
September 27, 2024
Technology
930
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
SQLによるオブザーバビリティの進化とClickHouseの実力
Miki Matsumoto
September 27, 2024
More Decks by Miki Matsumoto
See All by Miki Matsumoto
なぜAI時代データ基盤に ClickHouse が選れるか
mikimatsumoto
0
81
ClickHouseはどのように大規模データを活用したAIエージェントを全社展開しているのか
mikimatsumoto
0
470
オブザーバビリティとエージェント型AI - データ探索から答えへ -
mikimatsumoto
0
38
リアルタイムKPI分析のためのClickHouseとAIエージェント
mikimatsumoto
0
75
私のお気に入りの ClickHouse 最新機能
mikimatsumoto
0
59
MCPで強化する ClickHouseの業務改善
mikimatsumoto
0
140
リアルタイム分析で強化する AIエージェント
mikimatsumoto
0
56
なぜオブザーバビリティに ClickHouse なか?
mikimatsumoto
0
76
ClickHouse + Kafka 連携
mikimatsumoto
0
58
Other Decks in Technology
See All in Technology
GitHub Copilot 最新アップデート – 「一歩先」の実践活用術
moulongzhang
4
1.1k
AAIFに入ってみた ~内から見えるコミュニティ動向~
sato4
0
240
SONiCの統計情報を取得したい
sonic
0
180
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.5k
中期計画、2回作ってみた ~業務委託と正社員、両方の視点から~
demaecan
1
890
MCP Appsを作ってみよう
iwamot
PRO
4
660
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
140
Disciplined Vibes: Scaling AI-Assisted Engineering
sheharyar
0
150
2026 TECHFRESH 畢業分享會 - AI-Native 重塑軟體工程與虛擬講師
line_developers_tw
PRO
0
1.1k
非エンジニアがClaudeと挑んだ「1ヶ月間プロダクト30本ノック」
askokc
0
580
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
310
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
110
Featured
See All Featured
Paper Plane
katiecoart
PRO
1
51k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1.1k
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
210
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
55k
Amusing Abliteration
ianozsvald
1
200
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
370
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
620
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Marketing to machines
jonoalderson
1
5.5k
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
Transcript
SQLによるオブザーバビリティの進化と ClickHouse の実力 Sept 26, 2024 松本 幹 Senior Support
Engineer
About me • ClickHouseの日本人社員第1号 • 大規模データシステムの導入支援や技術サポートを中心 に活動(ClickHouse, Elastic, Domo)
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 3 目次 01 02
03 04 歴史的背景 ClickHouseとは ユースケース 共通の考慮事項
歴史的背景
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 5 SQLは50年以上前に開発されが、依然として人気 https://survey.stackoverflow.co/2024/technology#most-popular-technologies-language-prof 2024年のStackOverflowの
開発者向け調査結果によると、 SQLが2番目に人気のあるプログ ラミング言語にランクイン。 調査対象となった67,000人 以上のプロの開発者のうち、 半数以上が使用していると回答
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 6 リアルタイム解析用データベースの進化
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 7 同時に、DevOps におけるオブザーバビリティも進化
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 8 SQLとオブザーバビリティの統合
“オブザーバビリティは、単なる 大量データの問題 であるˮ
ClickHouse とは
2023 6月 ClickHouse Cloudが GCP上で一般提供開始 2022 12月 ClickHouse Cloudが AWS上で一般提供開始
2021 10月 シリーズB資金調達 ラウンドで、 250Mドルを 調達 2021 9月 シリーズA資金調達ラウンドで、 50Mドルを調達 正式にサービスを公開 2021 8月 ClickHouse, Inc. をアメリカで設立 2009 ClickHouseの プロトタイプを開発 2016 6月 ClickHouseを Apache 2.0ライセンスの 下で公開 100 リリース 2024 4月 ClickHouse Cloudが AWSの東京リージョンを サポート開始 2024 6月 ClickHouse Cloudが Azure上で一般提供開 始 ClickHouse の歴史
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 12 ClickHouse とは? オープンソース
2009年から開発開始 2016年にオープンソース化 36K以上のGitHubスター 1,000人以上のコントリビューター 300回以上のリリース カラム指向 分散 OLAP データベース 集計に最適 カラムごとのファイル管理 ソートとインデックス化 バックグラウンドマージ レプリケーション シャーディング マルチマスター 分析ユースケース 集計処理 データの可視化 ほぼイミュータブルなデータ
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 13 ClickHouse の特徴 1
2 3 高速なOLAPクエリ 大量のデータに対する 集計などの分析クエリ リソース効率が高い 革新的なデータ圧縮 - 10倍から100倍のストレージ効率 使いやすい アナリストに優しいSQL構文、 簡単に始められる、大規模な統合エコシステム https://benchmark.clickhouse.com
ユースケース
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 15 ログ分析プラットフォーム アーキテクチャ Log
shippers → Kafka → ClickHouse → Kibana LuceneクエリをSQLクエリに変換するQueryBridgeを 開発し、Kibanaを使用 メリット 高速なデータ取り込み コスト管理 トレードオフ スタックの管理、UIの開発 https://www.uber.com/blog/logging/ https://presentations.clickhouse.com/meetup40/uber.pdf
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 16 アーキテクチャの概要
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 17 オブザーバビリティの自社ユースケース アーキテクチャ OpenTelemetry
→ ClickHouse → Grafana メリット ログデータを詳細に、長期間にわたって保持可能 Datadog のコスト削減 トレードオフ 構築、保守に1.5人分の労力 https://clickhouse.com/blog/building-a-logging-platform-with-clickhouse-and-saving-millions-ov er-datadog
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 18 オブザーバビリティの自社ユースケース
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 19 約200倍の価格比 : ClickHouse
vs Datadog
共通の考慮事項 オブザーバビリティを構築するに向けて
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 21 クエリ言語の考慮 “SQLは、ドメイン固有のクエリ言語に比べてコンパクトではない?ˮ
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 22 シンプルなクエリ ? source=events
level=”warning” | STATS avg(duration) BY level | FIELDS level, avg(duration) AS avg_dur | sort - avg_dur | head 10
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 23 昔ながらの SQLでは...
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 24 スキーマの考慮 「メトリクス」「ログ」「トレース」を別々に考えるのではなく、それらを「ワイドイベント」と して一体的に捉えることが役立ちます。
https://isburmistrov.substack.com/p/all-you-need-is-wide-events-not-metrics https://news.ycombinator.com/item?id=39529775
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 25 スキーマの考慮事項 - Uberのケース
map や object などの複雑なデータ構造に 対応し、特定のスキーマに依存しない プラットフォーム向けに、データ取り込み時に柔軟に データを解析する仕組み
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 26 可視化の考慮 Grafana Apache
Superset Perses Metabase 独自で実装
©2024 CLICKHOUSE INC., CONFIDENTIAL & PROPRIETARY 27 SQL OLAP データベースの考慮
- リアルタイム - 高速なデータ取り込み(必要に応じてデータの取り込み後に変換可能) - 大量のデータに対して、一般的なクエリが数秒以内に完了する - データ圧縮 - 一般的なオブザーバビリティデータセットに対して、 10〜100倍の圧縮率 - ストレージとコンピュータリソースの分離 - オブジェクトストレージに大規模データセットを保存し、コンピュータのリソースをスケール可能 - 相互運用性 - 一般的なオブザーバビリティデータ収集ツール( OTel)やUI(Grafana)をサポート - SQL準拠 - ANSI SQLにどの程度準拠しているか? - 総所有コスト(TCO) - スイッチングコストを考慮
Thanks