検知システム 複数のモデルを組み合わせて ⾼い性能を実現 迅速に解析 フェイク/ 本物 鑑定対象メディア 画像データ ⾳声データ データセントリックなアプローチ * Representative Forgery Mining for Fake Face Detection * Preliminary Forensics Analysis of DeepFake Images * DataPerf: Benchmarks for Data-Centric AI Development 画像⽤ API ⾳声⽤ API ⽣成検知 API モデルセントリックなアプローチ
• Training set creation • Data selection • Data debugging • Data valuation ..and more Test Data Development • Test set creation • Slice discovery ..and more
• Training set creation • Data selection • Data debugging • Data valuation ..and more Test Data Development • Test set creation • Slice discovery ..and more ① どんな操作をする? ② どう評価する?
モデルを固定し、評価データセットを改善 • (⼈間に解けるが、)モデルにとって厳しいデータを追加する • Model-Centric AI のベンチマークのスコアが飽和していることへの直接的な改善になる ⽣成 AI 検知データ基盤構築 ⽣成画像として検知したい画像の中には「⼤量な⽣成」が難しいものも多い(FireFly 等) • 評価データセットには少量であってもそれらを追加する • テストスコアが改善するように Training set creation を⾏う • 過学習しないように定期的にアップデートする ↓ ② どう評価する?