$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ECCV2024現地参加報告
Search
hinako0123
August 29, 2025
0
16
ECCV2024現地参加報告
hinako0123
August 29, 2025
Tweet
Share
More Decks by hinako0123
See All by hinako0123
ICCV2025論文紹介:FlowEdit
hinako0123
0
44
ICCV2025現地参加報告
hinako0123
0
73
ICCV2025論文紹介:SAM2Long
hinako0123
0
78
CVPR2025現地参加報告
hinako0123
0
98
CVPR2025論文紹介:動画像分類
hinako0123
0
74
CVPR2025論文紹介:Segmentation
hinako0123
0
170
ECCV2024論文紹介:Vision & Language
hinako0123
0
140
ECCV2024論文紹介:Continual learning, Object detection
hinako0123
0
170
ECCV2024論文紹介:SAM
hinako0123
0
150
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Designing Experiences People Love
moore
143
24k
Typedesign – Prime Four
hannesfritz
42
2.9k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.8k
Docker and Python
trallard
47
3.7k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
KATA
mclloyd
PRO
33
15k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Writing Fast Ruby
sferik
630
62k
Site-Speed That Sticks
csswizardry
13
1k
Transcript
ECCV2024 Workshop M1 古川 陽一
会場
ECCV
Workshop 75件 ・3D vision ・Applications ・Art ・Autonomous Driving and Robotics
・Detection, Recognition, and Low-Level Vision ・Efficiency ・Human ・Medical and Bio-Inspired Vision ・Multimodal などなど
外に、
英語が苦手な人 ・あいさつから始める ⇒ ここで、日本から来たこと、世間話をしてくれる人もいる ⇒ ついでに、英語あんまり得意じゃないんだよっていう ⇒ だいじょうぶだよ?って言ってくれる ⇒ 全部聞き取れなくても、図から判断もできる
⇒ みんな優しい
BioImage Computing(BIC) 招待講演:評価指標に関する講演 背景と課題 (1)評価指標の限界 (2)指標間のミスマッチ (3)分散の欠如
招待講演:評価指標に関する講演
(1)評価指標の限界 一般的な評価指標(Accuracy, Dice係数, IoU) ⇒ 特定のタスクや状況で適切に機能しない場合がある ・Accuracy:クラス不均衡のデータセット ・Dice係数:クラス不均衡
Accuracy 例:2クラス分類タスク(陽性と陰性) Accuracyが95%でした!
Accuracy 例:2クラス分類タスク(陽性と陰性) ・シナリオ - 陰性クラス:950サンプル, 陽性クラス:50サンプル モデルがすべてのサンプルを陰性と予測した場合 陰性クラスのAccuracy:95% 陽性クラスのAccuracy:0%
Dice係数 例:腫瘍セグメンテーション ・シナリオ - 腫瘍A:大きな腫瘍(1000ピクセル) - 腫瘍B:小さな腫瘍(10ピクセル) タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測
Dice係数 タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測 𝐷𝑖𝑐𝑒𝐴 = 2 × 共通の面積 検出領域の面積
+ 正解領域の面積 = 2 × 900 900 + 100 = 0.947 𝐷𝑖𝑐𝑒𝐵 = 2 × 9 9 + 10 = 0.947
Dice係数 タスクの目的:腫瘍Bの検出が重要 ⇒ 今、モデルは腫瘍Aを90%、腫瘍Bを90%予測 𝐷𝑖𝑐𝑒𝐴 = 0.947 𝐷𝑖𝑐𝑒𝐵 = 0.947
全体のDice係数 𝐷𝑖𝑐𝑒𝑎𝑙𝑙 = 腫瘍𝐴の面積 × 𝐷𝑖𝑐𝑒𝐴 + 腫瘍𝐵の面積 × 𝐷𝑖𝑐𝑒𝐵 腫瘍𝐴の面積 + 腫瘍𝐵の面積 検出精度×対象の面積 ⇒面積が大きいクラスの変化に敏感
(2)指標のミスマッチ 一部の指標で良い ≠ 他の指標で性能が良い ・Accuracyが95% ⇒ PPV(陽性的中率)は0% ⇒ 陽性クラスを全く予測していない ・Balanced
Accuacyが85% ⇒ MCC(マシューズ相関係数)は5 𝑀𝐶𝐶 = 𝑇𝑃・𝑇𝑁 − 𝐹𝑃・𝐹𝑁 (𝑇𝑃 + 𝐹𝑃)・(𝑇𝑃 + 𝐹𝑁)・(𝑇𝑁 + 𝐹𝑃)・(𝑇𝑁 + 𝐹𝑁) 値の範囲 ・1:完全に正しい ・0:ランダムな予測 ・-1:完全に逆の予測
(3)分散の欠如 多くの論文:評価指標の平均値(Dice係数の平均値)のみ ⇒ 分散や信頼区間が示さていないことがある ・分散が大きい場合、モデルの性能やデータセットやタス ク間で一貫していない ⇒ それについての議論がないことが多い
Metrics Reload 目的:評価指標の選択、使用、解釈を体系的に整理する (1)平均と分散の空間での評価 (2)テストデータサイズと性能改善の関連性 (3)指標の複合的な使用 (4)シナリオ別の適切な指標提案
Metrics Reload (1)平均と分散の空間での評価 例:Dice係数の評価 X軸:平均性能(平均Dice係数) Y軸:分散の逆数(分散が小さいほど高評価)
Metrics Reload (2)テストデータサイズと性能改善の関連性 ・X軸:テストデータのサイズ(例:データポイント数) ・Y軸:精度の改善度(例:Dice係数の向上率) ⇒ テストデータが大規模でも性能改善が見られるモデル は、より信頼性が高いとされる
Metrics Reload (3)指標の複合的な使用 例①:Dice係数 + IoU + Haudorff距離 ・Haudorff距離:セグメンテーションの境界精度 例②:PPV(陽性的中率)+
Recall
Metrics Reload (4)シナリオ別の適切な指標提案 課題例 ①小さい腫瘍が全体のスコアにほとんど影響しない ②多数クラスに偏る評価指標 ③モデルの診断能力と誤診率のトレードオフ ⇒ 目的や主張に合った評価指標を選ぶべき
その他①
その他②
その他③
ご清聴ありがとうございました