Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
GPT-5.2で生成したパワポ
Search
fumisuke
December 12, 2025
Technology
0
48
GPT-5.2で生成したパワポ
fumisuke
December 12, 2025
Tweet
Share
More Decks by fumisuke
See All by fumisuke
ソフトウェアテストのAI活用_ver1.60
fumisuke
0
92
ソフトウェアテストのAI活用_ver1.50
fumisuke
0
410
ソフトウェアテストのAI活用_ver1.25
fumisuke
1
1.1k
ソフトウェアテストのAI活用_ver1.20
fumisuke
0
430
ソフトウェアテストのAI活用_ver1.10
fumisuke
0
510
AIにおけるソフトウェアテスト_ver1.00
fumisuke
1
600
Other Decks in Technology
See All in Technology
GitHub Copilotを使いこなす 実例に学ぶAIコーディング活用術
74th
3
1.4k
21st ACRi Webinar - Univ of Tokyo Presentation Slide (Ayumi Ohno)
nao_sumikawa
0
120
計算機科学をRubyと歩む 〜DFA型正規表現エンジンをつくる~
ydah
3
190
MapKitとオープンデータで実現する地図情報の拡張と可視化
zozotech
PRO
1
120
regrowth_tokyo_2025_securityagent
hiashisan
0
160
最近のLinux普段づかいWaylandデスクトップ元年
penguin2716
1
660
AWS Trainium3 をちょっと身近に感じたい
bigmuramura
1
120
AWS re:Invent 2025で見たGrafana最新機能の紹介
hamadakoji
0
120
21st ACRi Webinar - Univ of Tokyo Presentation Slide (Shinya Takamaeda)
nao_sumikawa
0
120
【CEDEC+KYUSHU2025】学生・若手必見!テクニカルアーティスト 大全 ~仕事・スキル・キャリアパス、TAの「わからない」を徹底解剖~
cygames
PRO
0
140
[CMU-DB-2025FALL] Apache Fluss - A Streaming Storage for Real-Time Lakehouse
jark
0
110
Playwright x GitHub Actionsで実現する「レビューしやすい」E2Eテストレポート
kinosuke01
0
330
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
Automating Front-end Workflow
addyosmani
1371
200k
Code Review Best Practice
trishagee
74
19k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.2k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Mobile First: as difficult as doing things right
swwweet
225
10k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.2k
Transcript
QAエンジニアにおける AI活用 品質保証プロセスの生産性・網羅性・学習速度を高める実装指針 作成日: 2025-12-12
目的と到達点 AIを「検証作業の補助」ではなく「品質保証の設計能力の拡張」として扱う。 対象業務 要求・仕様の読解、テスト観点抽出、テスト設計、期待結果(オラクル)設 計、テスト自動化、欠陥分析、運用時の品質監視を対象にする。 到達点 再現可能なプロンプト設計、成果物の検収基準、情報漏えい対策、 運用ガバナンス、効果測定指標、段階導入計画を確立する。 前提 AI出力は確率的であり、全出力を根拠として受容しない。人手によるレビューと、評価データによる検証を必須とする。
QA × AI Utilization
AI適用判断の基本構造 「反復性」と「検証可能性」を軸に、適用範囲とレビュー強度を定める。 検証可能性(高) 検証可能性(低) 反復性(低) 反復性(高) 例: 仕様要約、観点候補の抽出(レビュー前提) 例: テストケース生成、欠陥要約、ログ解析(検証容易)
例: UX評価案、探索テスト方針(妥当性審査) 例: 自動化コード雛形、回帰テスト整理(CIで検証) 適用判断: 反復性 × 検証可能性
SDLCにおけるAI活用ユースケース 工程ごとに入出力を固定化し、成果物として検収できる形にする。 要求・仕様 要約、用語集、矛盾検 出、受入条件の草案 テスト設計 観点抽出、境界値候補、 組合せ最小化の提案 実装支援 テスト容易性の設計レ
ビュー、ログ設計の助言 自動化 スクリプト雛形生成、セレ クタ改善案、失敗原因推 定 運用 障害要約、インシデント分 類、再発防止策の草案 共通の実装原則 入力(仕様、ログ、テスト対象)と出力(テスト成果物、修正案)をテンプレート化し、AI出力を差分として管理する。CIやレビューで検証できる設計にする。 SDLC全体に適用可能なテンプレート化
テスト設計におけるプロンプト設計パターン 段階分解と検収可能な中間成果物により、誤りの混入を局所化する。 仕様断片 テスト条件 テストケース 期待結果(オラクル) 自動化雛形 検収観点(例) テストケースは、入力値、事前条件、期待結果、事後条件を含む形で記述 する。期待結果が曖昧な場合は、仕様参照箇所を明示し、観測可能な指
標に落とし込む。 プロンプトの固定要素 対象の前提、禁止事項、出力フォーマット、網羅条件、例外条件、用語 定義を先に固定し、差分として仕様断片を投入する。 段階分解によりレビュー負荷を低減
テスト自動化における活用 AIは「コード生成」よりも「失敗原因の仮説形成」と「保守性向上」で効果が出やすい。 生成対象 ページオブジェクト、セレクタ候補、テストデータの前処理、検証用のアサー ション候補、ログ出力の追加案を生成対象にする。 検証方法 CIで実行できる最小スコープのテストを生成し、合格をもって採用する。失 敗時は、失敗ログの要約と再現手順の提示をAIに依頼し、原因を切り分け る。 補足
PlaywrightはモダンWebアプリ向けのE2Eテストフレームワークであり、複数ブラウザの実行や豊富なツールを提供している。 自動化の信頼性はCIによって担保する
欠陥分析・トリアージにおける活用 大量のログ・例外スタック・監視イベントを、再現可能な説明に変換する。 入力(例) 例外スタック、ログ断片、リクエスト/レスポンスのサマリ、直近の差分(コ ミット、設定変更)、監視メトリクスの急変点 出力(例) 1. 事象の要約(何が起きたか) 2. 影響範囲(ユーザー・機能・期間)
3. 再現手順(最小手順) 4. 主要仮説(優先度順) 5. 追加で必要な情報(ログや計測点) 6. 恒久対策の草案(検証計画を含む) ログ要約は「根拠となる行番号」付きで受領する
テストデータ生成と機密情報対策 生成は有効であるが、入力データ取り扱いの統制が前提になる。 推奨する生成対象 境界値セット、形式バリデーション用データ、ランダムだが制約を満たす データ、異常系データ、匿名化済みのログ断片を推奨する。 禁止・注意事項 本番由来の個人情報や秘密情報を投入しない。必要な場合はマスキング と最小化を実施し、出力の二次利用範囲を制限する。 統制チェック(例) 1.
入力データの分類(公開/社外秘/個人情報) 2. マスキングと最小化の実施 3. 出力の保存場所とアクセス制御 4. モデル利用規約と学習利用の有無 5. 監査ログ(誰が何を投入したか) 6. 破棄方針(保持期間、削除手順) 入力統制と出力管理をセットで設計する
主要リスクと対策の要点 LLM特有の脅威は、入出力の取り扱いと権限設計で低減できる。 入力系リスク プロンプトインジェクションにより、禁止事項の 回避や情報漏えいが起き得る。 対策として、システムプロンプトの分離、入力 の正規化、重要操作の二重確認を実施する。 出力系リスク 出力をそのまま実行すると、コード実行や設 定破壊につながる。
対策として、出力のサニタイズ、サンドボックス 実行、差分レビューを義務化する。 運用・統制リスク 誤情報の混入、責任所在の不明確化、再現 性の欠如が起きやすい。 対策として、評価データ、変更管理、監査ロ グ、利用者教育を整備する。 安全対策は「入出力」「権限」「監査」の三点で設計する
効果測定の指標設計 定量と定性を分け、ベースラインを先に確立する。 推奨する主要 KPI テスト設計リードタイム、欠陥検出率(工程別)、再現手順の品質、回帰テ ストの保守工数、レビュー指摘の再発率を主要KPIとして扱う。 評価の考え方 AI利用の有無で比較する際は、同一仕様・同一期間・同一チームの比較 を優先し、学習効果と季節変動を分離する。 作業時間(例
: 相対値) 注: グラフは説明用の仮データであり、効果は組織・対象に依存する
段階導入計画(例) 小さく始め、評価データと運用手順を同時に整備する。 0〜30日 対象業務を選定し、入力テンプレートと出力 フォーマットを定義する。 機密情報の取り扱い手順と利用規程を整備す る。 評価用の小規模データセットを作成する。 31〜60日 テスト設計と欠陥要約の業務で試行し、レ
ビュー手順を固定する。 効果測定を開始し、失敗パターンを収集する。 プロンプトとテンプレートを版管理する。 61〜90日 自動化雛形生成とログ解析に拡張し、CIと連 携して検証を自動化する。 監査ログとアクセス制御を運用に組み込む。 教育コンテンツを標準化する。 段階ごとに「テンプレート」「評価」「統制」を揃える
運用モデル(推奨) 権限設計と成果物の版管理により、属人化を防止する。 役割分担 QAはプロンプトと評価データのオーナーになり、開発は自動化基盤とCIを 整備する。セキュリティは入力統制と監査要件を定義する。 成果物管理 テンプレートとプロンプトはリポジトリで版管理し、変更はレビューを通す。 生成物は差分として保存し、再現性を確保する。 運用ポリシー(例) 1.
重要判断は人が最終承認する。 2. 機密データは投入しない(例外は申請制)。 3. 出力の自動実行を禁止し、差分レビューを義務化する。 4. 評価データで定期的に品質を点検する。 5. 監査ログを保管し、インシデント時に追跡可能にする。 運用設計は「権限」「版管理」「監査」で具体化する
付録: プロンプトテンプレート(抜粋) 再利用性と監査性を高めるため、テンプレートを版管理する。 テンプレート A(テスト条件抽出) 【目的】仕様断片からテスト条件を抽出する。 【入力】仕様テキスト、前提、用語集、除外範囲。 【出力】テスト条件を表形式で提示し、根拠となる仕様箇所を引用位置で示 す。 【制約】推測で補完しない。曖昧な場合は質問項目として分離する。
テンプレート B(欠陥要約・仮説) 【目的】失敗ログから再現手順と原因仮説を作る。 【入力】ログ断片、実行環境、直近変更、期待挙動。 【出力】1) 要約 2) 影響 3) 最小再現 4) 仮説 5) 追加情報。 【制約】出力の自動実行を前提にしない。 備考: テンプレートは、入力・出力・制約・検収基準の4要素を固定する。 Appendix