Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Introduction of QA4AI guideline(VUI)

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.
Avatar for Matsu Matsu
August 16, 2022

Introduction of QA4AI guideline(VUI)

This document provides an introduction to the AI Product Quality Assurance Guidelines.

https://www.qa4ai.jp/download/

Avatar for Matsu

Matsu

August 16, 2022
Tweet

More Decks by Matsu

Other Decks in Technology

Transcript

  1. どんな成果があったの? • The 32nd International Conference on Software Engineering &

    Knowledge Engineering (SEKE20) ◦ Best paper awards: Second place • 人工知能学会 ◦ 第2回 AI ELSI賞(Practice部門)
  2. 基本的な考え方部分に書かれている内容を簡単に紹介 AIプロダクトの品質保証において考慮すべき軸として、Data Integrity, Model Robustness, System Quality, Process Agility, Customer

    Expectationの5軸を挙げ、こ れらのバランスを取ることを推奨しています。ドキュメントにはそれぞれの軸のチェックリ ストも用意されています。 • Data Integrity ◦ 質においても量においても適切かつ充分なデータの確保、学習用データと検証用データが独立してい るかなどについて考慮 • Model Robustness ◦ モデルの精度と頑健性、デグレードなどについて考慮 • System Quality ◦ AI プロダクト全体の品質の確保について考慮 • Process Agility ◦ プロセスの機動性について考慮 • Customer Expectation ◦ よい顧客との関係性について考慮
  3. Voice User Interface (VUI)とは これまでCUI (Character User Interface / 文字によって操作)、GUI

    (Graphical User Interface / マウスなどで操作)がありました。それの音声バージョンです。音声によってシ ステムに指示を与える方式です。 スマートスピーカー カーナビ 家電
  4. VUI領域に書いている内容のざっくり紹介 • VUIシステムの特徴 ◦ 例えば音声認識であれば同じ言葉でも性別や設置環境、発話距離で入力が変わるなど、各機械 学習部分についてどういった特徴があるか記載 ◦ インフォテインメント ▪ 情報提供と娯楽の提供

    • 特有の課題 ◦ 音声入力のみで様々な機能が動作できる ◦ Process Agility ▪ よく使われるようになった言葉への対応 ▪ ニーズのキャッチアップと反映 • 機能安全 ◦ 簡単に操作できるゆえの意図しない動作を防ぐ ◦ 外部機器操作の誤認識への対応 ◦ カーナビなどによる運転を阻害しないために(情報送信のタイミング、情報量の調整)
  5. VUI領域に書いている内容のざっくり紹介 • 期待される品質 ◦ 5つの軸からの観点で記載 ◦ (今後もっと整理する予定) • テストアーキテクチャ ◦

    各テストレベル、テスト対象に対してどのようなテストを行った方が良いか ◦ もちろん、機械学習部分だけにとらわれるのではなく、ユニットテスト、統合テスト、システムテストと システム全体のテストを考える必要がある • 有効な手法、品質保証レベル ◦ 一部分を後程紹介 • 個人情報及びプライバシーの保護 ◦ 音声データの取り扱いや、情報の取り扱いについて ◦ 弁護士の方にも話を聞き、記載後のレビューもしてもらっている
  6. 有効な手法の一部分紹介 5段階評価の例: 1. 意図に反する異なる機能が実行される • 「音楽をかけて」に対して「占い」が実行される • 「コンビニに行きたい」に対して「電話」が実行される 2. 意図した機能が実行されるが、機能内において意図と異なるコンテンツが実行される

    • 「音楽を止めて」に対して「音楽の順送り」が実行される • 「シート倒して」に対してシートが起き上がる 3. 意図した機能が実行されるが、意図したことと異なる情報 /内容が返される • 「"歌手名"の曲をかけて」に対して「他の歌手の曲」が返される • 「"目的地"に行きたい」に対して「違う目的地」が設定される 4. 意図した機能が実行され、意図したコンテンツが返されるが、合っているとまでは言い難い • 「夏にあう曲をかけて」に対して、曲は返されるが夏の定番曲とは言い難い • 「"目的地"に行きたい」に対して、違う経由地の経路が返される 5. 意図した機能が実行され、意図した内容が返される • 「夏にあう曲をかけて」に対して、「夏の定番曲」が返される • 「"目的地"に行きたい」に対して、最短経路が返される プロダクトによってどこまで受け入れるかは変わるが、上の例では 1~3が「当たり前品質」にあたるような部分。