Upgrade to Pro — share decks privately, control downloads, hide ads and more …

コーディングAIが導くリスクベースド探索的テストの実践

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.

 コーディングAIが導くリスクベースド探索的テストの実践

2026年5月8日に開催された「LINEヤフー Development with Agents Meetup #3」の登壇資料です。
https://lycorptech-jp.connpass.com/event/388828/

More Decks by LINEヤフーTech (LY Corporation Tech)

Other Decks in Technology

Transcript

  1. © LY Corporation 2 Satoshi Fukuyama 2019年新卒入社 ローカル・UGC SBU所属 Orchestration

    Guildメンバー ローカル領域のフロントエンド開発チームをリードし、 生成AIを活用した開発プロセスの最適化と品質向上に取り組む。 また複数のハッカソンにおいて多数の受賞経験を持ち、 社内外での技術的挑戦を続けている。 LINEヤフー株式会社 Frontend Engineer & Div Lead
  2. © LY Corporation 6 業界共通のテスト課題 テストの判断は、ほとんどが "暗黙知" [ 原因 ]

    前回バグったから 念入りに ここはしっかり テストすべき 何となく、 ここ怪しそう…
  3. © LY Corporation 7 業界共通のテスト課題 テストの判断は、ほとんどが "暗黙知" [ 原因 ]

    バグが再発 テスト漏れで事故 ベテランしかバグを 見つけられない どこが危ない? 何を確認すべき? どう試すべき? 前回バグったから 念入りに ここはしっかり テストすべき 何となく、 ここ怪しそう…
  4. © LY Corporation 8 業界共通のテスト課題 テストの判断は、ほとんどが "暗黙知" [ 原因 ]

    バグが再発 テスト漏れで事故 ベテランしかバグを 見つけられない どこが危ない? 何を確認すべき? どう試すべき? 前回バグったから 念入りに ここはしっかり テストすべき 何となく、 ここ怪しそう… AI エージェントで "暗黙知" を "形式知" にできないか?
  5. © LY Corporation 9 本日のテーマ:リスクベースド × AIエージェント 過去のバグ傾向から "リスク" を可視化し、テスト深度に

    "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない? ③AIによる自動テスト = どう試すべき? ②テストケースの生成 = 何を確認すべき? ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─
  6. © LY Corporation 11 ①でやること:リスク分析表の生成 バグ起票チケットから、起きやすさ×影響に応じたリスク分析表をAIで生成する バグ起票チケット (GitHub Issue や

    JIRA チケットを想定) 出典:Sky株式会社 (2025) 発生確率・影響度マトリックス(リスクマネジメント)https://www.skygroup.jp/tech-blog/article/636/ ※サンプルアプリにおける結果
  7. © LY Corporation 12 リスク分析表を生成するスキルを作る リスク分析表を生成するスキル(risk-table-generation)を実装 以下のようにスキルをコマンドとして実行するだけでリスク表が生成される # Claude CodeやCodexの起動

    claude # リスク分析表を生成するスキル(risk-table-generation)を実行する # jira, githubなどのオプションがあり、それぞれの入力ソースに対応する › /risk-table-generation --jira # レポート用のMarkdownファイルおよびHTMLが生成されれば成功 • risk-table-generation --local を実行し、ローカルバグレポート10件からリスク表を生成しました。 - Markdown: risk-tables/risk-table-YYYYMMDD-HHMMSS.md - HTML: risk-tables/risk-table-YYYYMMDD-HHMMSS.html
  8. © LY Corporation 14 リスク分析スキルの実行結果(1) # ローカルに配置したバグレポートで分析 › /risk-table-generation --local

    ローカルバグレポートを使用してリスク表を生成します。まず、リファレンスファイルとバグレ ポートを読み込みます。 全バグレポートを読み込みました。Step 2の正規化を行います。 正規化の結果: - BUG-03: 機能領域なし → 原因コード(cartRepository.ts)から「カート・注文確定」に分類。優先度 Low → High(在庫超過注文の可能性 → データ整合性に影響) - BUG-06: 機能領域なし → 原因コード(クーポン適用条件判定)から「クーポン適用」に分類。優先度 Low → High(不正なクーポン適用 → 金額計算に影響) - その他8件: 補正なし TSVファイルを作成し、集計スクリプトを実行します。 集計完了。 A B C ※サンプルアプリにおける結果
  9. © LY Corporation 15 Step 4: リスク表のMarkdownファイルを生成します。 Write(省略/risk-tables/risk-table-20260427-000844.md) ⎿ Wrote

    72 lines to 省略/risk-tables/risk-table-20260427-000844.md Step 5: HTMLレポートに変換します。 Bash(bash .agents/skills/risk-table-generation/scripts/convert.sh risk-tables/risk-table-20260427-000844.md) ⎿ Generated: risk-tables/risk-table-20260427-000844.html HTML path: risk-tables/risk-table-20260427-000844.html D リスク分析スキルの実行結果(2) ※サンプルアプリにおける結果
  10. © LY Corporation 18 本日のテーマ:リスクベースド × AIエージェント 過去のバグ傾向から "リスク" を可視化し、テスト深度に

    "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない? ③AIによる自動テスト = どう試すべき? ②テストケースの生成 = 何を確認すべき? ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─
  11. © LY Corporation 21 テストケースを生成するスキルを作る テストケースを生成するスキル(test-case-generation)を実装 以下のようにスキルをコマンドとして実行するだけでテストケースが生成される # Claude CodeやCodexの起動

    claude # リスク分析表を生成するスキル(test-case-generation)を実行する › /test-case-generation --pr 3 • --pr 3 の差分と最新リスク表をもとに、テストケースを生成して保存しました。 作成ファイル: - test-cases/test-cases-20260406-215854.md
  12. © LY Corporation 25 本日のテーマ:リスクベースド × AIエージェント 過去のバグ傾向から "リスク" を可視化し、テスト深度に

    "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない? ③AIによる自動テスト = どう試すべき? ②テストケースの生成 = 何を確認すべき? ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─
  13. © LY Corporation 28 テストケースを実行するスキルを作る # Claude CodeやCodexの起動 claude #

    リスク分析表を生成するスキル(test-case-execution)を実行する › $test-case-execution • テストケース実行を完了し、結果を test-cases/test-cases-2026MMDD-HHMM.md の末尾に追記しまし た。 - 対象URL: http://localhost:3000 - 実行件数: 18 - 結果: PASS 17 / FAIL 1 / SKIP 0 - FAIL: C-4(商品追加導線で上限超過時に代金引換が自動解除されない) - スクリーンショット: test-cases/screenshots/C-4-20260413.png テストケースを実行するスキル(test-case-execution)を実装 以下のようにスキルをコマンドとして実行するだけでplaywright-mcpを使ってテストを実行できる
  14. © LY Corporation 32 本日のテーマ:リスクベースド × AIエージェント 過去のバグ傾向から "リスク" を可視化し、テスト深度に

    "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない? ③AIによる自動テスト = どう試すべき? ②テストケースの生成 = 何を確認すべき? ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─
  15. © LY Corporation 対象となる環境 34 直近対応したタスクについてリスク分析表生成、テストケース生成、AIによる自動テストを実施した 検証の概要 一部機能に対してローカル環境で検証 02 01

    対象となる修正内容 パフォーマンス改善のPR(数百行規模) 03 検証内容 リスク分析表の生成 +テストケースの生成 + AIによる自動テストの実施 04 使ったツール / モデル Claude Code / Claude Opus 4.7
  16. © LY Corporation リスクを考慮した テストケース数 34% 自動生成された テストケース数 41件 PRレビューの所要時間

    35 検証結果:手動テスト以外を 30分で完了 完了した テストケース数 70% 成果①:過去の重大なバグが再発してないことを確認できた 過去発生したリスクレベルの高いバグの再発無しを直接担保 成果②:人手だと1時間相当の作業を30分まで短縮 リスク表生成からテストケース生成・実行までAIが一気通貫で完走 ※本結果は特定の検証環境・条件下での一例です。すべてのプロジェクトで同様の効果を保証するものではありません。
  17. © LY Corporation 良かった点 36 良かった点 / 改善が必要な点 02 01

    03 「自動テスト可能」と判定したケースがモックやデータの都合で検証不能になり、 テスト環境整備はE2Eと同じ課題が残った 改善が必要な点 集中力が切れがちな異常系の繰り返し検証を、AIが淡々と代行してくれてムラなく 網羅できた リスクから考える過程で実装漏れUTが浮上し、AIがコード修正まで提案してくれて、 過去バグの再発を防止できた 任せるべき領域(観点生成・繰り返し検証)と人が向き合うべき領域 (テスト環境整備)の境界が、今回のフローで明確になった ※本結果は特定の検証環境・条件下での一例です。すべてのプロジェクトで同様の効果を保証するものではありません。
  18. © LY Corporation 38 本日のテーマ:リスクベースド × AIエージェント 過去のバグ傾向から "リスク" を可視化し、テスト深度に

    "メリハリ" をつける ─ それを AI が一気通貫で実行 ─ ①リスク分析表の生成 = どこが危ない? ③AIによる自動テスト = どう試すべき? ②テストケースの生成 = 何を確認すべき? ─ ベテランの "経験" を、組織の "仕組み" へ ─ ─ "暗黙知" を "形式知" に変える、3つのステップ ─
  19. © LY Corporation 起きやすさ×影響に沿ったリスク分析表の生成:どこが危ない? 過去3ヶ月分のバグ報告書(JIRAやIssueなど)を入力するだけで、5分で試作可能。 既存のデータがあれば、明日からでもリスク傾向が見えてきます。 リスク分析表に基づくテストケースの生成:何を確認すべき? 1つの PR・1つの機能領域から始めるのがおすすめ。 AI

    が生成したケースと既存テストケースの差分から、テストの抜け漏れが浮かび上がります。 AIによるリスクベースド探索的テストの実践:どう試すべき? 最初は1ケースだけ、AI に実行させて感覚を掴む。 繰り返しが必要な操作やシンプルな回帰テストを試してみて、日々の開発作業を楽にする。 01 03 02 39 これから取り組むチームへのおすすめステップ 以下の3つを小さく試しながら、自分たちのチームに合った形にカスタマイズしていくのがおすすめです 具体的なAgent Skillsの内容は近日中にテックブログで公開予定です!
  20. © LY Corporation 出典 Playwright MCP https://github.com/microsoft/playwright-mcp 41 Sky株式会社 (2025)

    発生確率・影響度マトリックス(リスクマネジメント) https://www.skygroup.jp/tech-blog/article/636/ GitHub Logo © GitHub, Inc. https://github.com/logos