Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIプロダクト時代のQAエンジニアに求められること
Search
imtnd
February 16, 2026
Programming
950
3
Share
AIプロダクト時代のQAエンジニアに求められること
AIプロダクトの品質保証を語ろう! - freee × マネーフォワード × LayerX
https://layerx.connpass.com/event/381467/
imtnd
February 16, 2026
More Decks by imtnd
See All by imtnd
QA/SDETの現在と、これからの挑戦
imtnd
0
2.1k
グローバルなソフトウェアテスト組織における課題と戦略 / Challenges and Strategies in a Global Software Testing Organization #mf_techday
imtnd
0
890
WACATE 2022 夏 ワークショップの目的
imtnd
0
1.1k
テスト設計技法をなぜ&どのように使うのか体験しよう!
imtnd
0
1.8k
analyze the behavior with decision table
imtnd
0
5.1k
WACATE流テスト分析のワークショップを体感してみよう
imtnd
0
300
テスト技法作成のアプローチを考える
imtnd
0
850
テストの目的を考えよう
imtnd
0
950
アジャイルとテスト / Agile and Testing
imtnd
1
2.2k
Other Decks in Programming
See All in Programming
「効かない!」依存性注入(DI)を活用したAPI Platformのエラーハンドリング奮闘記
mkmk884
1
330
事業会社でのセキュリティ長期インターンについて
masachikaura
0
250
Feature Toggle は捨てやすく使おう
gennei
0
590
今年もTECHSCOREブログを書き続けます!
hiraoku101
0
250
Make GenAI Production-Ready with Kubernetes Patterns
bibryam
0
120
感情を設計する
ichimichi
5
1.4k
存在論的プログラミング: 時間と存在を記述する
koriym
5
880
L’IA au service des devs : Anatomie d'un assistant de Code Review
toham
0
240
レガシーPHP転生 〜父がドメインエキスパートだったのでDDD+Claude Codeでチート開発します〜
panda_program
0
890
煩雑なSkills管理をSoC(関心の分離)により解決する――関心を分離し、プロンプトを部品として育てるためのOSSを作った話 / Solving Complex Skills Management Through SoC (Separation of Concerns)
nrslib
4
890
アクセシビリティ試験の"その後"を仕組み化する
yuuumiravy
0
140
Coding at the Speed of Thought: The New Era of Symfony Docker
dunglas
0
4.9k
Featured
See All Featured
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
350
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
Statistics for Hackers
jakevdp
799
230k
Navigating Weather and Climate Data
rabernat
0
170
Bash Introduction
62gerente
615
210k
A Tale of Four Properties
chriscoyier
163
24k
技術選定の審美眼(2025年版) / Understanding the Spiral of Technologies 2025 edition
twada
PRO
118
110k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Ruling the World: When Life Gets Gamed
codingconduct
0
200
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
98
Designing for Timeless Needs
cassininazir
0
190
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
3.8k
Transcript
AIプロダクト時代の QAエンジニアに求められること 2026.02.16
Money Forward, Inc. 2 角田 俊 社外活動 • JSTQB 技術委員 •
元・WACATE 実行委員 株式会社マネーフォワード CQO室
Money Forward, Inc. 3 Money Forward
Money Forward, Inc. 4 サービス一覧 これ以外にもマイクロサービスなど数多くのプロダクトが存在している 出典元 : 株式会社マネーフォワード 会社紹介資料
法人向け バックオフィス向け SaaS ファイナンスサービス 個人向け 金融機関等向け PFM(家計簿・資産管理)サービス Fintech推進・DX支援 金融機関・特定サービス向け マネーフォワード デジタル通帳・かんたん通帳
Money Forward, Inc. 5 開発拠点 ベトナム(ハノイ・ホーチミン) インド 東京 (田町) 名古屋
福岡 関西 (大阪・京都) 8 開発拠点
Money Forward, Inc. 6 Manami Turner, “エンジニア採用の未来:マネーフォワードが挑んだ「エンジニア組織完全英語化」の真相 ”, 2025/02/06, https://japan-dev.com/blog/money-forward-engineering-global-challenge-ja
(2026/02/07閲覧)
Money Forward, Inc. 7 “Moneyforwardクラウド with AI”, https://biz-ai.moneyforward.com/ (2026/02/07閲覧)
Money Forward, Inc. 8 QAとAIの関わり
Money Forward, Inc. 9 QA4AIとAI4QA AIシステムの品質保証 QA4AI(QA for AI) AI4QA(AI
for QA) AIシステムを活用した品質保証
Money Forward, Inc. 10 QA4AI AIプロダクト品質保証ガ イドライン AIプロダクト品質保証 コンソーシアム ,
2024/04/10 https://www.qa4ai.jp/ (2026/02/07閲覧) snsk, “AIシステムの製品品質モデル ISO/IEC25059:2023”, 2025/02/13, https://note.com/_snsk/n/nff496a4e2230 (2026/02/07閲覧) ISO/IEC25059:2023 国立研究開発法人産業技術総合研究所 , “生成 AI 品質マネジメントガイドライン ”, 2025/05/26, https://www.digiarc.aist.go.jp/publication/ aiqm/GenAIQuality-requirements-rev1.0.0 .0019.pdf (2026/02/7閲覧) 生成AI品質 マネジメントガイドライン
Money Forward, Inc. 11 AIシステムの特徴
Money Forward, Inc. 12 学習したデータから 振る舞いが決定する (学習ベース) 仕様から振る舞いが決定する (ルールベース) AIプロダクトの特徴
従来システム AIシステム
Money Forward, Inc. 13 従来システムとの違い AIシステムの特徴(一部) • ハルシネーションがある • 結果が決まらない(確率的)
• 仕様を決めるのが難しい • 進化が早い(現時点では) • AIの変更でシステムの振る舞いが変化する • テストデータが大量に必要になる • テストするべきインプットの定義が難しい • コンプライアンスなどの新しい問題が発生する
Money Forward, Inc. 14 従来のシステムのテストとの違い テスト結果をスコアで判定する 合格/不合格でテスト結果を評価する 従来システム AIシステム
Money Forward, Inc. 15 “AIエージェントの品質保証 〜QAが知識ゼロから挑んだ 3ヶ月間〜”, https://moneyforward-dev.jp/entry/2025/12/19/accurac y-validation (2026/02/07閲覧)
Money Forward, Inc. 16 対象とするAIシステム Frontend Backend
Money Forward, Inc. 17 QAの関わり方
Money Forward, Inc. 18 QAの関わり 計画 要件定義 テスト リリース
Money Forward, Inc. 19 計画 計画 要件定義 テスト リリース •
テストスケジュール検討 • リリース方法検討
Money Forward, Inc. 20 テストスケジュール検討 • AIモデルの精度検証、改善期間も含める ◦ AIの精度 ▪
検証 ▪ 改善 計画 要件定義 テスト リリース 精度向上を見越して、幅を持たせたスケジュール設定が必要
Money Forward, Inc. 21 リリース方法検討 • ユーザーの期待値を調整するリリース方法を検討する ◦ カナリアリリース ◦
ベータリリース UIの説明の記載方法、ヘルプサイトなどの記載でも期待値調整は可能 計画 要件定義 テスト リリース 試験版としてユーザーに提供する まず少数のユーザーに提供する カナリアリリース ベータリリース
Money Forward, Inc. 22 要件定義 計画 要件定義 テスト リリース •
精度目標 • リスク • AI制御
Money Forward, Inc. 23 精度目標 • AIの精度目標を決める ◦ ステークホルダーと会話する ▪
どういう傾向にするべきか • 緩くするのか、厳しくするのか • AよりBなのか、BよりAなのか ◦ 実際には、数値を計画の段階で決めるのは難しい 計画 要件定義 テスト リリース まずはどれくらいの精度であればユーザーにとって価値があるのかを認識する
Money Forward, Inc. 24 リスク • リスクマネジメントが必要 ◦ AIは予期しない動作を行う ◦
ステークホルダーと議論してリスクを洗い出す リスクに優先度を付ける 発生して欲しくないことを特定する リスクの特定 リスクの評価 計画 要件定義 テスト リリース
Money Forward, Inc. 25 AI制御 • システムとしてAIプロダクトの振る舞いを制御する AIへのインプット AIのアウトプット制御 AI
・フィルター ・加工 ・プロンプトエンジニアリング ・フィルター ・加工 計画 要件定義 テスト リリース
Money Forward, Inc. 26 テスト 計画 要件定義 テスト リリース •
テストピラミッド • VerificationよりもValidation • リスクベースドテスト • 自動テスト • バグバッシュ
Money Forward, Inc. 27 テストピラミッド Unit test API test E2E
test AI test AIも単体で精度のテストを実施する 他のAIにサービスを提供する(MCP)場合はAPI テストの重要性が上がってくる UIなどは機能提供の一つの方法にしかならないことも ある 計画 要件定義 テスト リリース
Money Forward, Inc. 28 VerificationよりもValidation ユーザーの要求に 一致するかを確認する 仕様が満たされていることを確認する Verification(検証) Validation(妥当性確認)
• AIプロダクトにおいては仕様を定義するのが難しい • 検証で用いたインプットと本番で使われるインプットがおなじとは限らない ユーザーの要求を満たせるシステムになっているかどうかを確認することが重要 計画 要件定義 テスト リリース
Money Forward, Inc. 29 リスクベースドテスト 1, 他の人の情報を元に回答を出すリスク 2,個人情報を回答するリスク 3,重要な判断情報を断定して回答するリスク 4,・・・
・ ・ ・ リスク一覧 • リスクベースドテスト ◦ リスクの高いことからテストする ◦ セキュリティテストも含まれる 計画 要件定義 テスト リリース
Money Forward, Inc. 30 自動テスト • 自動テスト ◦ AIの進化が早い ◦
AI精度の品質担保が必要 ▪ テストの頻度が多い ◦ テストレベルでテストを分ける ▪ AIのテスト ▪ システムとしてのテスト 計画 要件定義 テスト リリース さらに高速にフィードバックループを回せる環境を作成する必要がある
Money Forward, Inc. 31 バグバッシュ • バグバッシュ ◦ 専門家のテストが必要になることがある ◦
ユーザーとしてどう感じるかをテストする 計画 要件定義 テスト リリース 色々な視点から、色々なデータ、色々なユーザー情報などを使ってテストする 様々な部門の人を巻き込んで徹底的にテストする バグバッシュ
Money Forward, Inc. 32 リリース 計画 要件定義 テスト リリース •
モニタリング • ユーザーフィードバック
Money Forward, Inc. 33 モニタリング • システムとしてのモニタリング ◦ 社外での振る舞いをモニタリングする ▪
問題が発生したときに、原因を特定する ◦ 必要であればAIを改善していく 計画 要件定義 テスト リリース 例: • 応答速度 • コスト • 不正なインプット • 不正なアウトプット
Money Forward, Inc. 34 ユーザーフィードバック • ユーザーフィードバックを収集する ◦ ユーザーがどのようにAIを感じるかを評価する ▪
収集する仕組み ▪ 満足度 計画 要件定義 テスト リリース ChatGPT Gemini Rovo
Money Forward, Inc. 35 AI活用
Money Forward, Inc. 36 QA4AIとAI4QA AIシステムの品質保証 QA4AI(QA for AI) AI4QA(AI
for QA) AIシステムを活用した品質保証
Money Forward, Inc. 37 アプトプット • AIで様々なアウトプットが加速 ◦ ドキュメント ◦
ソースコード ▪ プロダクトコード ▪ テストコード ◦ データ
Money Forward, Inc. 38 AI4QA4AI AIシステムを活用したAIの品質保証 AI4QA4AI AIを活用し、高速に AIシステムの品質保証を行う
None