Upgrade to Pro — share decks privately, control downloads, hide ads and more …

決済サービスを支えるElastic Cloud - Elastic Cloudの導入と推進、決...

Avatar for suzukij suzukij
March 10, 2026

決済サービスを支えるElastic Cloud - Elastic Cloudの導入と推進、決済サービスのObservability

Elastic{ON} Tokyo 2026年3月10日

SBペイメントサービスでは、増大するログ量や運用負荷といった課題を背景に、決済サービスを支えるログ基盤をElastic Cloudへ段階的に移行しています。本セッション前半では、移行に至った背景や進め方、移行プロジェクトで直面した課題とそれに対する工夫についてご紹介します。後半では、実際に決済サービスの監視で活用しているダッシュボードを例に、Elastic AgentやAPMを用いたオブザーバビリティの実践的な取り組みをお伝えします。

Avatar for suzukij

suzukij

March 10, 2026
Tweet

More Decks by suzukij

Other Decks in Technology

Transcript

  1. 今井 健太 @shiba_dog
 SB Payment Service
 システム本部 運用統制部
 Elasticsearch +

    Kibanaで可視化利用を7年間
 JavaプログラマでWebシステムの開発・運用歴が長い
 現在の主な業務
 • 新規サービス開発・運用
 • 運用の改善

  2. ソフトバンク携帯ユーザー向けの 「ソフトバンクカード」のカード発行・ 運営をしています。 ソフトバンクカードは、Visa加盟店で 利用できるプリペイドカードです。ご 利用金額に応じてTポイントが貯ま ります。 カード発行業務 決済代行 EC運営事業者さま向けにオンライン決済

    事業を運営しています。豊富な決済手段 をまとめてご提供しています。 カード加盟店業務 Visa、Mastercard、UnionPay(銀聯)のメン バーシップライセンスを保有しており、各ブラ ンドのアクワイアラー(クレジットカード加盟店 契約会社)としての加盟店審査や管理事業、 端末決済サービスを提供しています。 ソフトバンクと共同で、ソフトバンク 携帯ユーザー向けの通話料合算請 求「ソフトバンクまとめて支払い」の 開発・運営をしています。 キャリア決済 EC/ネット店舗 実店舗/訪問販売 SBペイメントサービスの事業内容 決済代行からカード事業まで幅広く展開
  3. ソフトバンク携帯ユーザー向けの 「ソフトバンクカード」のカード発行・ 運営をしています。 ソフトバンクカードは、Visa加盟店で 利用できるプリペイドカードです。ご 利用金額に応じてTポイントが貯ま ります。 カード発行業務 決済代行 EC運営事業者さま向けにオンライン決済

    事業を運営しています。豊富な決済手段 をまとめてご提供しています。 カード加盟店業務 Visa、Mastercard、UnionPay(銀聯)のメン バーシップライセンスを保有しており、各ブラ ンドのアクワイアラー(クレジットカード加盟店 契約会社)としての加盟店審査や管理事業、 端末決済サービスを提供しています。 ソフトバンクと共同で、ソフトバンク 携帯ユーザー向けの通話料合算請 求「ソフトバンクまとめて支払い」の 開発・運営をしています。 キャリア決済 EC/ネット店舗 実店舗/訪問販売 SBペイメントサービスの事業内容 決済代行からカード事業まで幅広く展開
  4. 加盟店 決済機関 通販サイト ゲーム 教育 不動産 その他 電子書籍/動画 決済サービス 全て一本化

    チケット ECサイト向けに様々な決済手段を提供 加盟店に決済APIを提供するシステム クレジット 携帯キャリア決済 コンビニ支払い プリペイドカード 口座振替 ポイント支払い アカウント連携決済 当社 当社 API型 システム概要 オンライン決済サービス 画面リンク型
  5. 加盟店 決済機関 通販サイト ゲーム 教育 不動産 その他 電子書籍/動画 決済サービス 全て一本化

    チケット ECサイト向けに様々な決済手段を提供 加盟店に決済画面や決済APIを提供するシステム クレジット 携帯キャリア決済 コンビニ支払い プリペイドカード 口座振替 ポイント支払い アカウント連携決済 当社 当社 API型 システム概要 オンライン決済サービス 画面リンク型 多彩な決済手段を一括で導入可能 加盟店の手続きコスト、開発コストを削減
  6. 加盟店 決済機関 通販サイト ゲーム 教育 不動産 その他 電子書籍/動画 決済サービス 全て一本化

    チケット ECサイト向けに様々な決済手段を提供 加盟店に決済APIを提供するシステム クレジット 携帯キャリア決済 コンビニ支払い プリペイドカード 口座振替 ポイント支払い アカウント連携決済 当社 当社 API型 画面リンク型 導入実績 21.6 万店 (2021年 実績) システム概要 オンライン決済サービス
  7. 加盟店 決済機関 通販サイト ゲーム 教育 不動産 その他 電子書籍/動画 決済サービス 全て一本化

    チケット ECサイト向けに様々な決済手段を提供 加盟店に決済APIを提供するシステム クレジット 携帯キャリア決済 コンビニ支払い プリペイドカード 口座振替 ポイント支払い アカウント連携決済 当社 当社 API型 画面リンク型 決済手段 39 種類に対応 (2021年 実績) システム概要 オンライン決済サービス
  8. 加盟店 決済機関 通販サイト ゲーム 教育 不動産 その他 電子書籍/動画 決済サービス 全て一本化

    チケット ECサイト向けに様々な決済手段を提供 加盟店に決済APIを提供するシステム クレジット 携帯キャリア決済 コンビニ支払い プリペイドカード 口座振替 ポイント支払い アカウント連携決済 当社 当社 API型 画面リンク型 決済取扱高 9.8 兆円 (2024年実績) システム概要 オンライン決済サービス
  9. 加盟店 決済機関 通販サイト ゲーム 教育 不動産 その他 電子書籍/動画 決済サービス 全て一本化

    チケット ECサイト向けに様々な決済手段を提供 加盟店に決済APIを提供するシステム クレジット 携帯キャリア決済 コンビニ支払い プリペイドカード 口座振替 ポイント支払い アカウント連携決済 当社 当社 API型 画面リンク型 加盟店と決済機関の間に位置する 自社だけでは完結しない Webシステム システム概要 オンライン決済サービス
  10. 前半パート 
 Elastic Cloudの導入と移行推進 
 SBペイメントサービスで進めている、ログ基盤の Elastic Cloudへの段階的な移行についてご紹介しま す。移行の背景や進め方、プロジェクトの中で直面した 課題とその対応についてお話しします。

    今日お話すること 今井 健太
 SBペイメントサービス 
 システム運用統制部 プロジェクト推進課 
 後半パート 
 決済サービスの Observability
 前半でご紹介するログ基盤の上で、どのように監視や 可視化を行っているのかをご紹介します。Elastic AgentやAPMを活用したダッシュボードを例に、決済 サービスにおけるオブザーバビリティの実践をお伝え します。 鈴木 順也
 SBペイメントサービス 
 システム運用統制部 

  11. 再設計の判断 拡張 オンプレミス増強 部分的な性能改善 既存構造の延長 → 一時的な改善 再設計 構造そのものを見直す 将来増加を前提にする

    運用体制と整合させる → 持続可能な構造へ 拡張か、再設計か検討した結果、再設計と判断した
  12. これまでのログ基盤構成 ログ基盤 別プロダクトを利用 - データ増加 メトリクス基盤 別システムで収集 - 保持圧迫 可視化基盤

    オンプレElasticStack - 容量限界 - 構成肥大化 ログ基盤・メトリクス基盤は別プロダクトで、可視化基盤として Elasticを運用 こっちを採用 
 取り込み遅延! 
 こっちを採用 
 保持期間圧 迫!

  13. これまでのログ基盤構成 ログ基盤 別プロダクトを利用 - データ増加 メトリクス基盤 別システムで収集 - 保持圧迫 可視化基盤

    オンプレElasticStack - 容量限界 - 構成肥大化 ログ基盤・メトリクス基盤は別プロダクトで、可視化基盤として Elasticを運用 こっちを採用 
 連携効果が高い 
 → 統合
 こっちを採用 
 役割が異なるため別 運用

  14. 頻繁×短い - データ量小
 - アラート監視
 - 調査用途
 稀×短い - 特になし


    頻繁×長い - データ量少
 - メトリクス
 - 傾向分析
 稀×長い - データ容量大
 - 障害調査
 - 傾向分析
 アクセス頻度 保持期間 保持期間と必要性 ログの用途を整理し、 アクセス頻度 × 保持期間で分類した
  15. 頻繁×短い - データ量小
 - アラート監視
 - 調査用途
 稀×短い - 特になし


    頻繁×長い - データ量少
 - メトリクス
 - 傾向分析
 稀×長い - データ容量大
 - 障害調査
 - 傾向分析
 アクセス頻度 保持期間 保持期間と必要性 ログの用途を整理し、アクセス頻度 × 保持期間で分類した こっちを採用 
 過去データはあまり重用ではない 
 リアルタイム性が重要 

  16. 頻繁×短い - データ量小
 - アラート監視
 - 調査用途
 稀×短い - 特になし


    頻繁×長い - データ量少
 - メトリクス
 - 傾向分析
 稀×長い - データ容量大
 - 障害調査
 - 傾向分析
 アクセス頻度 保持期間 保持期間と必要性 ログの用途を整理し、アクセス頻度 × 保持期間で分類した こっちを採用 
 応答速度は気にしない 
 抽出自体ができることが重要 

  17. Data Tier の利用検討 HOT WARM COLD FROZEN Enterprise 通常は HOT

    → WARM → COLD → FROZEN と段階的に移行
  18. Data Tier の利用検討 大 小 速 遅 HOT WARM COLD

    FROZEN Enterprise 両極端な構成にする設計判断
  19. Data Tier の利用検討 大 小 速 遅 HOT WARM COLD

    FROZEN Enterprise 両極端な構成にする設計判断
  20. Data Tier の利用検討 HOT WARM COLD FROZEN Enterprise フルデータを ローカル保持

    ローカル保持 ノードに データ保持 保持なし SSD・高速I/O HDD中心 検索可能 スナップショット 検索可能 スナップショット FROZENはノードにデータを持たないため、実質どこまでも保持が可能
  21. Data Tier の利用検討 HOT WARM COLD FROZEN Enterprise フルデータを ローカル保持

    ローカル保持 ノードに データ保持 保持なし SSD・高速I/O HDD中心 検索可能 スナップショット 検索可能 スナップショット FROZENはノードにデータを持たないため、実質どこまでも保持が可能 こっちを採用 
 過去データの調査や 
 長期間の傾向分析が 
 低コストで可能 になった

  22. データの収集設定 アプリA Logs アプリB Logs ミドルA Logs ミドルB Logs namespace

    dataset SYS01  GP01 SYS01  GP02 app access logs-sys01-gp01-app-* logs-sys01-gp01-access-* logs-sys01-gp01-error-* logs-sys01-gp02-app-* logs-sys01-gp02-access-* logs-sys01-gp02-error-* : : 当初は、namespaceやdatasetでデータの分類を行っていた
  23. データの収集設定 アプリA Logs アプリB Logs ミドルA Logs ミドルB Logs namespace

    dataset SYS01  GP01 SYS01  GP02 app access logs-sys01-gp01-app-* logs-sys01-gp01-access-* logs-sys01-gp01-error-* logs-sys01-gp02-app-* logs-sys01-gp02-access-* logs-sys01-gp02-error-* : : 当初は、namespaceやdatasetでデータの分類を行っていた Index数増! 性能劣化!!
  24. データの収集設定 アプリA Logs アプリB Logs ミドルA Logs ミドルB Logs namespace

    dataset SYS01 SYS02 app access metadata 役割 グループ logs-sys01-app-* logs-sys01-access-* logs-sys01-error-* : : フィールドで管理する方針に変更
  25. クレジットカード系 A クレジットカード系 B クレジットカード系 C 携帯電話キャリア決済 A 携帯電話キャリア決済 B

    携帯電話キャリア決済 C スマートフォン決済 A スマートフォン決済 B コンビニ決済 A その他決済 A その他決済 B コンビニ決済 B 赤く表示されているグラフが障害によって影響が発生した決済手段 サービス監視ダッシュボード(障害時の状況)

  26. ログ、メトリクス、トレースの監視範囲を拡大し、システム全体の可視化レベルは高まった 今までの監視状況 ②
 Elasticsearch Kibana 決済システム Apps Logstash 他ツールB サーバリソース

    CPU / メモリ 他ツールA アプリログ 他ツールC アプリリソース スレッド数、DBコネク ションプール、ヒープ、 GC 他ツールD トレース 決済トランザクション App App App App App App App App App
  27. ログ、メトリクス、トレースの監視範囲を拡大し、システム全体の可視化レベルは高まった 監視ツールが分散 / 乱立している、アプリケーションログの活用できていない 今までの監視状況 ②
 Elasticsearch 決済システム Apps Logstash

    他ツールB サーバリソース CPU / メモリ 他ツールA アプリログ 他ツールC アプリリソース スレッド数、DBコネク ションプール、ヒープ、 GC 他ツールD トレース 決済トランザクション App App App App App App App App App Kibana
  28. 決済機関のゲートウェイを担うレガシーなシステム モダナイゼーションプロジェクトを契機に監視基盤の刷新 今回の話の対象システム
 SBPS決済システム バックエンド アプリケーション フロントエンド アプリケーション 購入要求 購入結果

    加盟店 (ショッピングサイト) 加盟店 (ショッピングサイト) 加盟店 (ショッピングサイト) 決済機関 決済機関 決済機関 APM Java Agent Elastic Agent アプリをSpring Bootで刷新、 Elastic Agent、APM Java Agentを 導入して監視を強化
  29. アプリにElastic APM Agentを導入し、トレース、メトリクスを取得 APMサーバを経由して Elasticsearchに保存 Observability構成 - APM Agent
 APM

    Elasticsearch Kibana 決済バックエンド アプリケーション APM Java Agent App Logs メトリクス トレース Elastic Agent
  30. アプリケーションログを JSONで構造化された状態でログ出力し、 Elastic Agentによって構造化された状態のまま Elasticsearchに投入 Observability構成 - Elastic Agent
 APM

    Elasticsearch Kibana 決済バックエンド アプリケーション APM Java Agent App Logs ログ(JSON 構造化ログ) Elastic Agent
  31. Webアプリケーションにとって関心の高い処理(リクエスト、 DB、外部通信)を一気通貫で可視化 APM Agentによるアプリケーション監視
 監視対象
 APM Java Agent Database 外部システム

    APM Elasticsearch Kibana ② SQL実行 ③ HTTPS通信 ①②③を含むトレースを送信 決済アプリケーション 
 ① リクエスト ① レスポンス
  32. Webアプリケーションにとって関心の高い処理(リクエスト、 DB、外部通信)を一気通貫で可視化 APM Agentによるアプリケーション監視
 監視対象
 APM Java Agent Database 外部システム

    APM Elasticsearch Kibana ② SQL実行 ③ HTTPS通信 ①②③を含むトレースを送信 決済アプリケーション 
 ① リクエスト ① レスポンス どのAPIが、いつ・どれだけ 呼び出され、 応答にどれくらい時間がかかったのかが把握できる
  33. Webアプリケーションにとって関心の高い処理(リクエスト、 DB、外部通信)を一気通貫で可視化 APM Agentによるアプリケーション監視(SQL)
 監視対象
 APM Java Agent Database 外部システム

    APM Elasticsearch Kibana ② SQL実行 ③ HTTPS通信 ①②③を含むトレースを送信 決済アプリケーション 
 ① リクエスト ① レスポンス どのSQLが、いつ・どれだけ 呼び出され、 応答にどれくらい時間がかかったのかが把握できる
  34. Webアプリケーションにとって関心の高い処理(リクエスト、 DB、外部通信)を一気通貫で可視化 APM Agentによるアプリケーション監視(外部通信)
 監視対象
 APM Java Agent Database 外部システム

    APM Elasticsearch Kibana ② SQL実行 ③ HTTPS通信 ①②③を含むトレースを送信 決済アプリケーション 
 ① リクエスト ① レスポンス どの通信処理が、いつ・どれだけ 呼び出され、 応答にどれくらい時間がかかったのかが把握できる
  35. APMが収集してくれたトレース情報を利用して HTTP通信の実行状況を可視化 APM Agent 外部通信監視ダッシュボード
 HTTP通信トレース情報 ステータスコード別 件数 結果別 件数

    送信先エンドポイント別 件数 応答時間(パーセンタイル) 接続先別 応答時間 接続エラー /レスポンスタイムアウト件数
  36. 監視ツールが分散 / 乱立 ⇒ Kibanaですべて監視を集約 アプリケーション監視が乏しい ⇒ 構造化ログとトレースで効果的なダッシュボードを整備 ログ /

    メトリクス / トレース / サービス すべての監視をKibanaで
 Elasticsearch Kibana Logstash 他ツールB サーバリソース CPU / メモリ 他ツールA アプリログ 他ツールC アプリリソース スレッド数、DBコネク ションプール、ヒープ、 GC 他ツールD トレース 決済トランザクション バックエンド アプリケーション APM Java Agent Elastic Agent APM Elasticsearch Kibana
  37. 今後について(生成AIの活用)②
 
 AI Agent Builderを使用せずに Claude Code(+自作skill)から直接アクセスする分析も検証中 Tool定義もMCPもなしの状態 で検証 Agent

    Skills ・playwright-cli ・tracktool-monitor playwright-cli skill でサービス全体の監視ダッシュボードを参照し、スクリーンショット取得お よび各チャートのクエリ確認を行う。 その後、Kibana API 経由で Elasticsearch にクエリを実行し、決済状況を確認してレポート する。 ※Skill には具体的な手順やスクリプトは含めず、ダッシュボードで使用されるフィールドの業 務的な意味と定義のみを整理している。 playwrightでヘッドレスブラウザ操作 スクリーンショットと ダッシュボード情報を取得 MCPなしで直接 APIの呼び出し
  38. 今後について(生成AIの活用)②
 
 AI Agent Builderを使用せずに Claude Code(Skills作成)から直接アクセスする分析も検証中 出力結果( 検証中だけど かなり良い感じ

    ) ログ/メトリクス /トレースを Elastic Cloudに集約しているからこそ、 AIの力を最大限に活用できる 監視 ⇒ サービス改善 ⇒ AI活用(AI Agent Builderに期待)
  39. Elastic Cloudによる監視基盤の統合 ▪ 課題 ログ基盤のログ量増加による性能問題 ▪ 解決 Elastic Cloudへの移行でデータの取込遅延を 解消し、リアルタイムな状況把握を実現

    合わせてデータ保持期間の延長により、過去 の決済データの調査効率が大幅に向上 ▪ 課題 運用体制の制約やコスト整合への問題 ▪ 解決 Elastic Cloudを採用することによって 運用コス トの増加が抑えられた。 さらに、Frozen Tierの活用により 保持期限を 延長したにもかかわらずコストの大幅増を抑え られた まとめ

  40. 決済サービスの Observability ▪ 課題 アプリケーションのログ /ダッシュボードが乏しい 状態だった ▪ 解決 モダナイゼーションの際に

    Elastic Agent・APM Agentを導入し、サービス観点のダッシュボード を構築 システム全体の Observabilityを強化し、 障害 検知の迅速化、パフォーマンスボトルネックの 可視化を実現 ▪ 課題 監視ツール /サービスが分散していた ▪ 解決 ログ / メトリクス / トレースの全てを Elasticsearchに集約し、監視を Kibanaに一元 化 監視ツール / 調査ツールの統一により、 調査作 業の効率化、調査品質の向上 を実現 まとめ