Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
3次元点群の分類における評価指標について
Search
Kenta Itakura
July 31, 2024
Research
0
410
3次元点群の分類における評価指標について
Kenta Itakura
July 31, 2024
Tweet
Share
More Decks by Kenta Itakura
See All by Kenta Itakura
LiDARとカメラのセンサーフュージョンによる点群からのノイズ除去
kentaitakura
0
130
センサーフュージョンを利用した橋梁の構造情報の推定
kentaitakura
0
63
深層学習を利用した3次元点群の分類を行う際の手順について
kentaitakura
0
350
外積やロドリゲスの回転公式を利用した点群の回転
kentaitakura
1
650
Segment Anything Modelを利用して 農作物のセグメンテーションを行ってみた
kentaitakura
0
320
LIMEを用いた判断根拠の可視化
kentaitakura
0
340
グリーンレーザーにより取得した3次元点群から海底や水面を分類した事例
kentaitakura
0
350
複数の入力の深層学習ネットワークの作成について
kentaitakura
0
180
LiDARとカメラのセンサーフュージョンによる点群のノイズ除去
kentaitakura
1
490
Other Decks in Research
See All in Research
文化が形作る音楽推薦の消費と、その逆
kuri8ive
0
160
20240820: Minimum Bayes Risk Decoding for High-Quality Text Generation Beyond High-Probability Text
de9uch1
0
120
Large Vision Language Model (LVLM) に関する最新知見まとめ (Part 1)
onely7
18
3.1k
ニュースメディアにおける事前学習済みモデルの可能性と課題 / IBIS2024
upura
3
510
FOSS4G 山陰 Meetup 2024@砂丘 はじめの挨拶
wata909
1
110
Language is primarily a tool for communication rather than thought
ryou0634
4
740
2024/10/30 産総研AIセミナー発表資料
keisuke198619
1
330
機械学習でヒトの行動を変える
hiromu1996
1
300
MetricSifter:クラウドアプリケーションにおける故障箇所特定の効率化のための多変量時系列データの特徴量削減 / FIT 2024
yuukit
2
120
文書画像のデータ化における VLM活用 / Use of VLM in document image data conversion
sansan_randd
2
190
Weekly AI Agents News! 8月号 プロダクト/ニュースのアーカイブ
masatoto
1
190
工学としてのSRE再訪 / Revisiting SRE as Engineering
yuukit
19
11k
Featured
See All Featured
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
42
9.2k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
26
2.1k
Designing for Performance
lara
604
68k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Happy Clients
brianwarren
98
6.7k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
How GitHub (no longer) Works
holman
310
140k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.1k
Navigating Team Friction
lara
183
14k
RailsConf 2023
tenderlove
29
900
The Cult of Friendly URLs
andyhume
78
6k
A better future with KSS
kneath
238
17k
Transcript
3次元点群の分類における評価指標について ImVisionLabs株式会社
3次元点群とは 3次元点群とは点の集合であり、3次元形状を表す 1 最近は、都道府県や建物の3次元点群データが公開されている 例)中野サンプラザ、綾瀬川 ※埼玉県より公開されている 道路・河川の3Dマップのデータを利用しています ※中野区より公開されているデータを利用しています
セマンティックセグメンテーション 2 ラベル付け前と後の画像 各点を分類し、どのような物体か判別する 画像出典: PLATEAU 「AIを用いた3D都市モデルの自動更新手法の開発」 https://www.mlit.go.jp/plateau/use-case/uc22-044/ 例) 人、車、植生、壁、フェンス
セマンティックセグメンテーションの例 セグメンテーションにより周辺環境を把握 例 道路、歩行者、障害物、標識、白線 衝突リスクの軽減する 走るべき場所を検出し、自動運転に寄与 3 自動運転 https://jp.mathworks.com/help/lidar/ug/automate- lidar-labeling-for-semantic-segmentation.html
https://medium.com/nerd-for-tech/autonomous-driving-annotation- case-study-semantic-segmentation-in-3d-point-cloud- 98e6da4f4dc0
分類精度評価指標の重要性 5 モデル A 分類精度 0.7 Loss 6 モデル B
分類精度 0.6 Loss 4 モデル A 分類精度 0.7 分類精度の高いA を採用しよう! 3割ほど誤分類のリ スクあるから、人によ る確認も追加しよう 分類精度をもとに最適なモデルを選択可能 誤分類の傾向を知ることでリスク回避につながる
予測値と正解の値(混同行列) 6 正 負 正 True Positive (TP) False Negative
(FN) 負 False Positive (FP) True Negative (TN) 機械学習モデル 手動でラベリング 予測 正解 予測と正解 が一致
全体精度(Accuracy) 7 正 負 正 True Positive (TP) False Negative
(FN) 負 False Positive (FP) True Negative (TN) Accuracy = TP + TN TP + TN + FP + FN = • シンプルな計算方法 • データセット全体の予測性能を評価 • クラス間で点数が大きく異なる場合に使いにくい メリット デメリット
再現率(Recall)、適合率(Precision) 8 Precision = TP TP + FP Recall =
TP TP + FN 予測値が正であるものが、 正解が正であるものをどれ だけ再現しているか 予測値が正であるものが、 正解が正であるものに適合 しているか トレードオフ 正 負 正 TP FN 負 FP TN 予測 正解
F1スコア 9 Precision Recall F1 = 2 × Precision ×
Recall Precision + Recall RecallとPrecisionの調和平均(逆数の和の平均の逆数) 調和平均は、2つの値がどちらも高い場合にのみ高い値を示す クラスの不均衡に対応しつつ、全体のデータセットの予測性能を評価できる
調和平均 vs 算術平均 10
IoU(Intersection over Union) 11 IoU = TP TP + FP
+ FN データセット全体の予測性能を評価 実際に真 予測が真 TP FP FN TN 正 負 正 TP FN 負 FP TN 予測 正解
具体例(クラスの不均衡) 12 正解データ 予測データ Accuracy: 0.995 Recall:0.928 Precision:0.540 F1:0.683 IOU:0.518
ほとんどが負のデータ であり、TP、FN、FP の比率にかかわらず、 Accuracyは大きくなる 正 負 正 TP 4428 FN 346 負 FP 3768 TN 876131 正解 予測 ※東京都より公開されている 東京都デジタルツイン実現プロジェクトのデータを利用しています 電線を正とする
具体例(クラス不均衡) 13 正解データ 予測データ Accuracy: 0.990 Recall:0.681 Precision:0.244 F1:0.360 IOU:0.220
同様にAccuracyは高 いが、Recall、 Precisionは低くなる 正 負 正 TP 2397 FN 1123 負 FP 7413 TN 873740 正解 予測 ※東京都より公開されている 東京都デジタルツイン実現プロジェクトのデータを利用しています 鉄塔を正とする
具体例(過剰予測) 14 正解データ 正 負 正 10758 (TP) 0 (FN)
負 67371 (FP) 0 (TN) 予測データ Accuracy: 0.14 Recall:1.00 Precision:0.14 F1:0.24 IOU:0.14 全然正しくないが Recallは高い ※DALESデータセットを利用しています 家を正とする
まとめ 15 iPhone12 LiDAR 3次元点群とは • 点の集合で3次元形状を表す 例:中野サンプラザ、綾瀬川 セマンティックセグメンテーション •
各点にクラスを分類(例:道路、歩行者) 利点:自動運転のリスク軽減 分類精度評価指標 • 指標例:Accuracy、Recall、Precision、F1スコア、IoU 分類精度評価の具体例を例示 • 目的に合った評価指標を中心に評価する必要性