Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「見た目」と「意味」をAIが判定 ~ビジュアルアサーションで変わる テストの守備範囲~

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

「見た目」と「意味」をAIが判定 ~ビジュアルアサーションで変わる テストの守備範囲~

2026年3月25日に開催したmablウェビナーのスライドです。

More Decks by Masahiko Funaki(舟木 将彦)

Other Decks in Technology

Transcript

  1. 今日お伝えすること • 従来のアサーションが苦手だったこと • ビジュアルアサーションの3つの価値 ◦ 視覚的判定 (Visual Judgement): 見た目・状態を判定

    ◦ 意味的分析 (Semantic Analysis): 文脈・言語・関連性を判定 ◦ ノーコード (Zero Code): すべてが自然言語で書ける • 具体的なユースケース4選とデモ • 信頼性を高めるベストプラクティス
  2. ビジュアルアサーションとは 課題提起 • 自然言語プロンプトでページ・ダウンロードファイルの内容を検証 • 大規模言語モデル(LLM)が「判定」する → 意味・文脈・傾向を理解 • Google

    Cloud Vertex AI (Gemini) 基盤 (顧客データをトレーニングに不使用) • ルールベースのアサーションでは難しかったケースをAIで解決
  3. Zero Code ー すべてが自然言語で書ける Zero Code: 共通メリット • コードを書かずに自然言語でアサーションを記述 •

    エンジニア以外もアサーションを作成・レビュー可能 • 「何を確認したいか」をそのまま書けばよい ◦ 例:「週次売り上げチャートが上昇傾向を示し、エラーアイコンがないこと」
  4. ダウンロードファイル検証 2軸の統合例 • 対応形式:PDF, PNG, JPG, GIF, WEBP, BMP •

    Visual Judgment: 画像レイアウト・デザイン確認 • Semantic Analysis: 請求書の顧客名・金額・振込先の確認 • ここにもZero Code: 専用パーサー不要、自然言語で完結
  5. ポイント②:適切な厳密さを指示 ベストプラクティス • 曖昧過ぎ → 「ページが読み込まれた」(重要要素の欠落を見逃す) • 厳密すぎ → 条件が多すぎて評価困難

    (複数アサーションに分割を) • 具体例:ソートされたテーブルの検証 ◦ ❌「テーブルが昇順にソートされていること」→ 重複値があるとFAIL ◦ ✅「テーブルが昇順にソートされていること(同じ値が連続する場合も許容)」 → PASS
  6. 知っておくべき制限事項 制限・注意事項 項目 内容 上限数 テスト当たり最大30個。 追加コスト クラウド実行で0.5クレジット/回。 非対応 パフォーマンステスト内では失敗。

    結果の言語 英語で返る傾向あり。日本語で受け取るにはプロンプト末尾に「結果 を日本語で返してください」と追記。 評価範囲 ビューポート内の表示部分のみ。画面外の要素は評価されない。
  7. Q&A