ペアーズにおけるAIエージェント基盤とText to SQLツールの紹介

ペアーズにおけるAIエージェント基盤とText to SQLツールの紹介 2025年12⽉20⽇ AI Builders Day

About Me Nari | Takashi Narikawa（@fukubaka0825） • 株式会社エウレカ ◦ 2020年に⼊社
▪ SRE Team -> AI Team ssmt | Hikaru Sasamoto（@hisamouna34） • 株式会社エウレカ ◦ 2022年に⼊社 ▪ SRE & Data Platform Team

出典：MMD研究所「2025年マッチングサービス・アプリの利用実態調査」　　　2025年9月時点。交際率においては利用上位5サービス・アプリが対象。 No. 1 恋活・婚活マッチングアプリ利用率交
際率

1. AIエージェントおよびLLMOps基盤の設計と運⽤体制について紹介 2. 具体的な活⽤事例として社内向けText to SQLツールを紹介 a. 背景 / 課題
b. Text to SQL Workﬂow の紹介 c. AWS サービスを使うことで実現できたこと d. 品質を継続的に評価‧改善する仕組み e. Text to SQL によるチーム別課題への貢献 f. 今後の展望 3. まとめ Agenda

①AIエージェントおよび LLMOps基盤の設計と運用体制について紹介

AIエージェントおよびLLMOps基盤の設計と運⽤体制について紹介 SREチームの課題感 • AIOpsに関わるスキルはPlatformを担うSREチームのケイパビリティとして持っているべきだが、キャッチアップできていない... AIチームの課題感 • AIチームは、LLMやAIOpsに先⾏投資を⾏っているが、リソースが限られており⾼頻度で変化する多様
な開発者のニーズを把握して対応するのはきつい... AIチーム SREチーム

AIエージェントおよびLLMOps基盤の設計と運⽤体制について紹介 • 先⾏投資しているAIチーム + 守備範囲が幅広くニーズを把握しているSREが協働し、キャッチアップやAIOpsの実践に向けてLLM for Developerチームとしてプロジェクトチームを組成 Assemble!!!

AIエージェントおよびLLMOps基盤の設計と運⽤体制について紹介 SREが投資するAIOps ~ペアーズにおけるLLM for Developerへの取り組み~

ペアーズでのLLM基盤① 社内AI Workﬂow / AI Agent API基盤 Internal通信推論 Claude
Agent SDK Server

ペアーズでのLLM基盤② 内製MCP Server Tools • MCPは、アプリケーションがLLMにコンテキストを提供する⽅法を標準化するオープンプロトコルです。 • ペアーズでは、プロダクトのバックエンドでメインで採⽤しているGo⾔語を中⼼に、内製のMCP
Server Toolsを作ってCursor/Claude Code/Codex CLI/Gemini CLI経由で使ったりAI Agentから使⽤している ◦ 弊社は主要AI Coding Toolがほぼ全て⾃由に選択可能な状態 (※1) (※1) https://docs.anthropic.com/ja/docs/agents-and-tools/mcp Claude Code

ペアーズでのLLM基盤③ LLMOps基盤 (※2) ペアーズでの、Langfuseを中⼼とした評価ドリブンなリリースサイクルのご紹介 (※2)

ペアーズにおけるAmazon Bedrockを⽤いた障害対応⽀援⽣成AIツールの導⼊事例 AIエージェントおよびLLMOps基盤の設計と運⽤体制について紹介

ペアーズにおける評価ドリブンな AI Agent 開発のご紹介 AIエージェントおよびLLMOps基盤の設計と運⽤体制について紹介

② 具体的な活用事例として社内向け Text to SQLツールを紹介

[背景] 分析業務におけるチームの⽴ち回り • PDM Team ◦ プロダクトの計画‧結果確認のためにデータ分析をしたい ◦ これまでは⾃らで SQL
を作成して実⾏することは少なかった • BI Team ◦ 分析依頼を受けて BigQuery にクエリを実⾏し、結果を依頼者へ共有 • SRE & Data Platform: 分析基盤の運⽤を担当 • このようにチームが分かれて分析を⾏っていたがいくつかの課題があった

データ活⽤におけるチーム別の課題チーム課題説明 PDM → BI リードタイムが長い分析依頼が集中し、結果を得るまで時間がかかる BI
分析の属人化得意分野が異なり、担当外分析で時間を要した全体ナレッジ共有の不足ドキュメントが少なく、暗黙知に依存していた

課題解決の⼿段として、Text to SQL に注⽬ • 複数ある課題の中でも、「分析の属⼈化」への対処が特に効果的と推測 ◦ 分析が⼀部のメンバーに偏っていると、その⼈が担当する機会が多くなり、結果としてナレッジの⾔語化‧共有が後回しになりがちになる ◦
属⼈化を解消することで、分析リードタイムの短縮にもつながる可能性 • 解決の⼿段として、「⾃然⾔語でクエリを⽣成できる仕組み = Text to SQL」に注⽬

Text to SQLフローの初期検証フローはMastraで構築

Text to SQLフローの初期検証 1. 分析テーブルの特定 2. コンテキスト(スキーマ情報)取得 3. SQL生成
のシンプルなフロー

• 質問⽂と⽣成 SQL をドメインエキスパート (BI チーム)に確認したところ実務で使える品質ではなかった • 1. 分析テーブルの特定
の問題点 ◦ テーブル・カラムの名前やDescriptionだけでは対象テーブルの特定ができないケースがあった • 2. コンテキスト取得の問題点 ◦ スキーマ情報だけでは判断できない、ドメイン知識を要するケースが多かった • 浮かんだ疑問 ◦ 「普段 BI チームはどうやって対象のテーブルを推定し、必要なコンテキストを取得‧把握しているのか？」期待に添えるアウトプットを⽣成できなかった

• BIチームの“暗黙知”を形式化するために、分析フローを細かく分解 • BIチームにヒアリング ◦ BIチームのシニアメンバーがサンプル分析要件を考えて、ジュニアメンバーがその要件からどうやって分析SQLを導き出すのかの分析のデモをしてもらった • デモから普段のBIチームの分析ステップを構造化した
• 定義したフローをもとに、Text to SQL Workﬂow へ落とし込む Text to SQL 構築の第⼀歩：現場理解から始める設計

Text to SQLフロー

⼊⼒ (例) Slack Chat に分析要件を自然言語で入力専用の絵文字をリアクションすることで Workﬂow 実行開始

Step: 分析対象テーブルを決める ① ワークスペース選択 - ワークスペースとは、事業ドメインやデータ利用目的ごとに分かれた分析領域 (例: ログイン、決済) -
ユーザーの質問文から、LLM が最も関連度が高いワークスペースを選定し、クエリ生成の候補となるテーブルを選択する ② テーブル検索 - ①で選択できなかった場合、DataCatalog のデータをセマンティック検索できるように Knowledge Bases に保存しているテーブル情報データから質問文に関連していそうなテーブルを選択テーブル・カラム名だけでは対象テーブルの特定ができないケースがあったへの対策 // ワークスペース定義例 // 内容を全てプロンプトに含めて // LLMで適切な対象テーブルを選択 const WORKSPACE_DEFINITIONS = { Login: { description: 'User login activity related queries', tables: { 'login_a': ['keyward_a', 'keyward_b'], 'login_b': ['keyward_a', 'keyward_c'], }, }, …

Step: 対象テーブル関連の情報を取得 ③ DDL 取得 - 選択されたテーブルのスキーマ情報を BigQuery API経由で取得 ④
サンプル SQL 取得 - GitHub上の再利用可能なSQL（定期分析・BI用など）をKnowledge Base化 - 質問文と意味的に近い SQLを検索して取得 ⑤ Doc取得 - コード規約や各テーブルのドキュメントを取得スキーマ情報だけでは判断できない、ドメイン知識を要するケースが多かったへの対策

Step: SQL ⽣成の⾃動化と⾃⼰修正 ⑥ SQL 生成 - 取得したコンテキストをもとに SQL を生成
⑦ 検証 - BigQuery API で生成 SQL を dry-run して、構文チェック ⑧ 自己修正 - dry-run 失敗時は、エラーログをコンテキストに詰めて再度 SQL 生成を行う

出⼒: 分析者が理解しやすい形で返す入力データである質問のSlackチャットのスレッドに出力メッセージを表示させる

(再掲) Text to SQLフロー

• Lambda, Bedrock, S3, IAM などを組み合わせて、インフラからLLMまで AWS上で完結できる • LambdaからBedrock呼び出しまでIAMロールで⼀元管理できるため、 APIキー不要
• Amazon Bedrock Knowledge Bases を使うことで簡単にセマンティック検索可能に AWS を使うことで実現できたこと

• オフライン評価 ◦ PR をイベントに実⾏される評価バッチ on Github Actions ◦ テストインプットデータで⽣成されたアウトプット
SQL を正解 SQL と⽐較する ◦ 評価プロンプトが両⽅のクエリを⾒て採点 ◦ 評価プロンプトの精度チェック⽤にもテストデータを⽤意 • オンライン評価 ◦ クエリ⽣成後に Slack Chat 上で質問者に採点するボタンを提⽰ ◦ Langfuse からトレースデータをエクスポートして分析 ▪ 利⽤数/⽇、利⽤ユニークユーザ数/⽇品質を継続的に評価‧改善する仕組み

Text to SQL によるチーム別課題への貢献チーム課題 Text to SQL 導入による貢献
PDM → BI リードタイムが長い PDM 自身が SQL を生成し自走して分析できるようになった BI 分析の属人化特定の分析者に依存せず必要な分析用 SQL を自分たちで生成できるようになった全体ナレッジ共有の不足ドキュメント整備が Text to SQL の精度・パフォーマンス向上につながることでドキュメントを整備する動機が高まった

• テーブルメタデータの拡充 ◦ 出⼒精度をさらに⾼めたい ◦ データ量が膨⼤なため、まずは頻出ユースケースに絞って対応する • Slack Chat 以外のインターフェース提供
◦ エンジニア向けにローカル実⾏環境を整備し、⾼速なやり取りを可能にする • 複数ラリーでの応答改善 ◦ 1回⽬の⽣成結果が不⼗分な場合、修正点を提⽰して再⽣成できるようにする • AI Agent 化 ◦ ケースに応じた柔軟なタスク実⾏を⾏い、精度を向上させる今後の展望

We’re hiring! ペアーズではエンジニアを積極採⽤中！カジュアル⾯談もお待ちしております！ (X: @hisamouna34)

ペアーズにおけるAIエージェント基盤とText to SQLツールの紹介

ペアーズにおけるAIエージェント基盤とText to SQLツールの紹介

Hikaru Sasamoto

More Decks by Hikaru Sasamoto

Other Decks in Technology

Featured

Transcript