Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
小ねぎ調製位置検出のためのインスタンスセグメンテーション
Search
Takuto ANDO
January 11, 2025
Research
610
0
Share
小ねぎ調製位置検出のためのインスタンスセグメンテーション
Takuto ANDO
January 11, 2025
More Decks by Takuto ANDO
See All by Takuto ANDO
A Detailed Analysis of LLM Execution on IMAX3 and Initial Evaluation of IMAX4 Prototype for Server Environment
takuto_andtt
0
110
DPUを用いたマルチタスクDNN表情認識システムのFPGA実装
takuto_andtt
0
630
エッジ検出を用いた小ねぎ分岐部の検出
takuto_andtt
0
130
Facial Expression Recognition System Using DNN Accelerator with Multi-threading on FPGA
takuto_andtt
0
42
Other Decks in Research
See All in Research
Φ-Sat-2のAutoEncoderによる情報圧縮系論文
satai
4
650
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
710
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.7k
明日から使える!研究効率化ツール入門
matsui_528
12
7k
RS-Agent: Automating Remote Sensing Tasks through Intelligent Agent
satai
0
140
Sequences of Logits Reveal the Low Rank Structure of Language Models
sansantech
PRO
1
250
Model Discovery and Graph Simulation: A Lightweight Gateway to Chaos Engineering
anatolykr
0
160
機械学習で作った ポケモン対戦bot で 遊ぼう!
fufufukakaka
0
200
【NICOGRAPH2025】Photographic Conviviality: ボディペイント・ワークショップによる 同時的かつ共生的な写真体験
toremolo72
0
240
SoftMatcha 2: 1兆語規模コーパスの超高速かつ柔らかい検索
e869120_sub
6
3.3k
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
960
AIスーパーコンピュータにおけるLLM学習処理性能の計測と可観測性 / AI Supercomputer LLM Benchmarking and Observability
yuukit
1
870
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.2k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
180
A better future with KSS
kneath
240
18k
ラッコキーワード サービス紹介資料
rakko
1
3.4M
Measuring & Analyzing Core Web Vitals
bluesmoon
9
830
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
340
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
120
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Mind Mapping
helmedeiros
PRO
1
200
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.3k
Darren the Foodie - Storyboard
khoart
PRO
3
3.3k
Transcript
小ねぎ調製位置検出のための インスタンスセグメンテーション 安藤 拓翔1 井上 優良2 1大分工業高等専門学校 専攻科 電気電子情報工学専攻 2大分工業高等専門学校
情報工学科 D-27 2024年度 第32回 電子情報通信会九州支部 学生会講演会 9/25
1/26 発表内容
2/26 発表内容
3/26 農業従事者の不足 小ねぎ調製作業における省力化・軽労化のために 農業機械による自動化が要求される 小ねぎ調製作業とは 葉の皮むきを指す 出荷するためには1芯1葉に調製する 大分県の小ねぎ調製場では人手不足が課題 1芯1葉(合わせて2枚に)
4/26 調製方法 上下の水圧ノズルにより不要な葉の除去 精度が低く 一度に全ての不要な葉を取り除くことができない 人手による二次処理を要する 現行の調製手順 小ねぎ調製機の図 調製後の小ねぎ 調製機
調製前の小ねぎ レーンの向き ノズル
5/26 不要な葉を一度に除去するには 小ねぎの最上部の分岐部位置にノズルを合わせて投入 個体によって異なる分岐部位置を判別する必要がある 方法:水圧ノズルの位置合わせをする[1] ノズル イメージ図 小ねぎの上部 小ねぎの下部 [1]大分県(2022)大分県スマート農林水産業推進方針,
〈https://www. pref.oita.jp/soshiki/15060/sumart.html〉, 2024 年 2 月 10 日参照 目標精度:90%
6/26 分岐部位置の判別方法 画像認識により判別 YOLOなどのDNNによる物体検出が挙げられる 分岐部が遮蔽された場合は検出できない 検出可能 検出不可 × ◯ 分岐部の隠れ
7/26 本研究では 分岐部が遮蔽された場合でも対応 1つの葉が分岐して2枚の葉に変化した箇所 分岐部位置と推定 インスタンスセグメンテーションにより 葉の位置から分岐部を推定する手法の有効性の評価 本研究の目的 葉の形状から分岐部の位置を推定 インスタンスセグメンテーションにより
葉の枚数をカウント
8/26 発表内容
9/26 1. エッジ検出による分岐部検出 分岐部にある繊維斜線を検出[2] 分岐部には斜線のような繊維がある特徴を利用 [2] 安藤 拓翔, 井上 優良,
エッジデバイス上におけるリアルタイム小ねぎ分岐部位置検出, 農業情報研究, 2024, 33 巻, 2 号, p. 73-80 組込み機器でも容易に動作可能 ただし 遮蔽は× エッジ検出により分岐部斜線を抽出することで 分岐部位置を検出
10/26 2. YOLOXによる分岐部検出 YOLOXによる分岐部の検出 組込み機器向けの軽量なモデルを利用 精度は約96% 白ねぎを対象とした分岐部検出[3] [3] 小野竜也, 井上
優良, YOLOX を用いた白ねぎの葉の分岐部検出,2023, 2023年度(第31回)電子情報通信学会九州支部学生会講演会, D-22 ただし 遮蔽は× (小ねぎより遮蔽が少ないため問題なし)
11/26 本研究の立ち位置 先行研究の共通した特徴 カメラで分岐部を撮影できる前提 分岐部が遮蔽されていれば検出はできない 本研究では 小ねぎは葉が重なり合うことが多いため 分岐部の遮蔽によらない検出手法を提案
12/26 発表内容
13/26 提案手法 処理の流れ 画像の取得 前処理 推論 小ねぎ画像を取得 コントラスト強調 インスタンスセグメンテーション実行 葉の位置情報から枚数の変化箇所を識別
分岐部位置の判別 y座標の出力 最上位分岐部と推定した位置のy座標を出力
14/26 画像の取得と前処理 処理の流れ 画像の取得 前処理 推論 分岐部位置の判別 y座標の出力 調製前の小ねぎ1本を撮影した画像を取得 推論の精度を上げるため
前処理としてヒストグラム平坦化を適用 [4] コントラストの調整 - MATLAB & Simulink, (https://www.mathworks.com/help/images/contrast-adjustment_ja_JP.html), 2024 年 9 月 18 日参照 コントラストの補正 補正前 補正後 [4]
15/26 インスタンスセグメンテーションとは 処理の流れ 領域分割して物体の種類を認識できる手法 2つのセグメンテーションの違い セマンティックと違い、同じクラスでも個別に抽出 利用したモデル:Mask-RCNN
16/26 処理の流れ アノテーション:芯クラスと葉クラスで区別 芯クラス:根から小ねぎの先端まで伸びている葉 葉クラス:芯から分岐している外葉 芯 クラス 葉 クラス
17/26 推論 (インスタンスセグメンテーションを実行) 処理の流れ 画像の取得 前処理 推論 分岐部位置の判別 y座標の出力 Mask-RCNNにより
葉と芯のインスタンス領域を推論 物体のバウンディングボックスを取得
18/26 葉の位置と枚数から分岐部位置を推定 分岐部位置の判別と出力 画像の取得 前処理 推論 分岐部位置の判別 y座標の出力 葉の枚数が変わっている箇所が 分岐部であると推定して出力
最上位分岐部 (このy座標を出力) 第2分岐部 3 2 1
19/26 発表内容
20/26 本実験の目的 推論処理を認識精度(正解率*)の観点で性能評価 物体検出モデル(YOLOX)と比較 葉の位置から分岐部を推定する手法の 検出精度と分岐部の遮蔽に対する有効性の評価 * 正解位置との差が1cm未満を検出成功とする 出力y座標と正解y座標の差が50px未満であれば正解 上下誤差
1.0cm 正解位置
21/26 評価方法 K-分割交差検証 (K = 10) 目的:テストデータセットの偏りによる精度の影響を防ぐため … テストデータ 学習データ
430枚のデータを10分割 1つ(43枚)をテストデータ 残り(387枚)を学習データ 10回実験を実施して 全ての画像について評価 430 枚 1 2 10 43枚
22/26 実験 (2つの実験により本手法の有効性を評価) 02 分岐部が遮蔽された画像で評価 01 すべての小ねぎ画像で評価 小ねぎデータセット430枚すべての画像に対して 正解率を評価(分岐部が遮蔽された画像も含む) 430枚のなかで、分岐部が遮蔽されていると判断した
39枚のうち正解率を評価
23/26 実験結果 すべての小ねぎ画像(遮蔽を含む)と遮蔽画像の評価 全ての画像を評価すると精度はYOLOXの推論が上回る 一方で、分岐部が遮蔽した場合ではMask-RCNNが大幅に上回る 89 72 0 20 40
60 80 100 YOLOX Mask-RCNN 正解率 [%] 実験1:すべての画像(430枚)の評価 38 89 0 20 40 60 80 100 YOLOX Mask-RCNN 正解率 [%] 実験2:分岐部が遮蔽した画像(39枚)の評価 2.34 倍
24/26 提案手法の有効性について 葉が見えていれば推定可能 分岐部が遮蔽されていても葉を個体ごとに認識することが できれば分岐部位置を推定可能 ただし全体の精度は物体検出モデルに劣る そのため現時点では実応用は不可 成功例
25/26 発表内容
26/26 まとめ インスタンスセグメンテーションにより葉の位置を抽出して 葉の形状から分岐部を推定する手法を提案 分岐部が遮蔽された場合の検出率は 89% & YOLOXの約2.34倍 分岐部が遮蔽された場合の検出の有効性を確認 分岐部が遮蔽されていない場合の精度の向上
物体検出モデルと組み合わせた検出手法の検討 今後の課題
appendix
28/26 Mask-RCNN Faster-RCNNをセグメンテーション向けに拡張したモデル 物体検出(Faster-RCNN)+セグメンテーション機能 物体検出結果として得られた領域に対してセグメンテーション 2ステップで推論を実行 Object detection task Segmentation
task
29/26 Detectron2 Meta Research が提供するモデル作成用ライブラリ 物体検出やセグメンテーションモデルを作成可能 Apache 2.0 ライセンスで商用利用も可 事前に学習されたResNet-50を転移学習
30/26 実験環境 CPU Intel(R) Core(TM) i5-11400 GPU NVIDIA GeForce RTX-3060
OS Ubuntu 20.04 プログラミング言語 Python 3.11.4
31/26 データセット 大分県宇佐市北部小ねぎ共同調製場にて 調製される小ねぎを撮影した430枚の画像 撮影位置は固定 解像度 : 1920 x 1080
32/26 検出可否の基準 出力y座標と正解y座標を比較 正解位置との差が1cm未満を検出成功とする 出力y座標と正解y座標の差が50px未満であれば正解 上下誤差 1.0cm 正解位置