Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
小ねぎ調製位置検出のためのインスタンスセグメンテーション
Search
Takuto ANDO
January 11, 2025
Research
0
470
小ねぎ調製位置検出のためのインスタンスセグメンテーション
Takuto ANDO
January 11, 2025
Tweet
Share
More Decks by Takuto ANDO
See All by Takuto ANDO
A Detailed Analysis of LLM Execution on IMAX3 and Initial Evaluation of IMAX4 Prototype for Server Environment
takuto_andtt
0
34
DPUを用いたマルチタスクDNN表情認識システムのFPGA実装
takuto_andtt
0
500
エッジ検出を用いた小ねぎ分岐部の検出
takuto_andtt
0
95
Facial Expression Recognition System Using DNN Accelerator with Multi-threading on FPGA
takuto_andtt
0
36
Other Decks in Research
See All in Research
空間音響処理における物理法則に基づく機械学習
skoyamalab
0
140
若手研究者が国際会議(例えばIROS)でワークショップを企画するメリットと成功法!
tanichu
0
130
長期・短期メモリを活用したエージェントの個別最適化
isidaitc
0
350
SNLP2025:Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
230
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
370
J-RAGBench: 日本語RAGにおける Generator評価ベンチマークの構築
koki_itai
0
1.1k
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
110
論文紹介: ReGenesis: LLMs can Grow into Reasoning Generalists via Self-Improvement
hisaokatsumi
0
150
When Learned Data Structures Meet Computer Vision
matsui_528
1
1.6k
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.3k
視覚から身体性を持つAIへ: 巧緻な動作の3次元理解
tkhkaeio
0
110
AIスパコン「さくらONE」のLLM学習ベンチマークによる性能評価 / SAKURAONE LLM Training Benchmarking
yuukit
2
910
Featured
See All Featured
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.6k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Leo the Paperboy
mayatellez
0
1.2k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
45
Designing for humans not robots
tammielis
254
26k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
2
2.8k
Art, The Web, and Tiny UX
lynnandtonic
304
21k
BBQ
matthewcrist
89
9.9k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
410
Become a Pro
speakerdeck
PRO
31
5.7k
Agile that works and the tools we love
rasmusluckow
331
21k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
290
Transcript
小ねぎ調製位置検出のための インスタンスセグメンテーション 安藤 拓翔1 井上 優良2 1大分工業高等専門学校 専攻科 電気電子情報工学専攻 2大分工業高等専門学校
情報工学科 D-27 2024年度 第32回 電子情報通信会九州支部 学生会講演会 9/25
1/26 発表内容
2/26 発表内容
3/26 農業従事者の不足 小ねぎ調製作業における省力化・軽労化のために 農業機械による自動化が要求される 小ねぎ調製作業とは 葉の皮むきを指す 出荷するためには1芯1葉に調製する 大分県の小ねぎ調製場では人手不足が課題 1芯1葉(合わせて2枚に)
4/26 調製方法 上下の水圧ノズルにより不要な葉の除去 精度が低く 一度に全ての不要な葉を取り除くことができない 人手による二次処理を要する 現行の調製手順 小ねぎ調製機の図 調製後の小ねぎ 調製機
調製前の小ねぎ レーンの向き ノズル
5/26 不要な葉を一度に除去するには 小ねぎの最上部の分岐部位置にノズルを合わせて投入 個体によって異なる分岐部位置を判別する必要がある 方法:水圧ノズルの位置合わせをする[1] ノズル イメージ図 小ねぎの上部 小ねぎの下部 [1]大分県(2022)大分県スマート農林水産業推進方針,
〈https://www. pref.oita.jp/soshiki/15060/sumart.html〉, 2024 年 2 月 10 日参照 目標精度:90%
6/26 分岐部位置の判別方法 画像認識により判別 YOLOなどのDNNによる物体検出が挙げられる 分岐部が遮蔽された場合は検出できない 検出可能 検出不可 × ◯ 分岐部の隠れ
7/26 本研究では 分岐部が遮蔽された場合でも対応 1つの葉が分岐して2枚の葉に変化した箇所 分岐部位置と推定 インスタンスセグメンテーションにより 葉の位置から分岐部を推定する手法の有効性の評価 本研究の目的 葉の形状から分岐部の位置を推定 インスタンスセグメンテーションにより
葉の枚数をカウント
8/26 発表内容
9/26 1. エッジ検出による分岐部検出 分岐部にある繊維斜線を検出[2] 分岐部には斜線のような繊維がある特徴を利用 [2] 安藤 拓翔, 井上 優良,
エッジデバイス上におけるリアルタイム小ねぎ分岐部位置検出, 農業情報研究, 2024, 33 巻, 2 号, p. 73-80 組込み機器でも容易に動作可能 ただし 遮蔽は× エッジ検出により分岐部斜線を抽出することで 分岐部位置を検出
10/26 2. YOLOXによる分岐部検出 YOLOXによる分岐部の検出 組込み機器向けの軽量なモデルを利用 精度は約96% 白ねぎを対象とした分岐部検出[3] [3] 小野竜也, 井上
優良, YOLOX を用いた白ねぎの葉の分岐部検出,2023, 2023年度(第31回)電子情報通信学会九州支部学生会講演会, D-22 ただし 遮蔽は× (小ねぎより遮蔽が少ないため問題なし)
11/26 本研究の立ち位置 先行研究の共通した特徴 カメラで分岐部を撮影できる前提 分岐部が遮蔽されていれば検出はできない 本研究では 小ねぎは葉が重なり合うことが多いため 分岐部の遮蔽によらない検出手法を提案
12/26 発表内容
13/26 提案手法 処理の流れ 画像の取得 前処理 推論 小ねぎ画像を取得 コントラスト強調 インスタンスセグメンテーション実行 葉の位置情報から枚数の変化箇所を識別
分岐部位置の判別 y座標の出力 最上位分岐部と推定した位置のy座標を出力
14/26 画像の取得と前処理 処理の流れ 画像の取得 前処理 推論 分岐部位置の判別 y座標の出力 調製前の小ねぎ1本を撮影した画像を取得 推論の精度を上げるため
前処理としてヒストグラム平坦化を適用 [4] コントラストの調整 - MATLAB & Simulink, (https://www.mathworks.com/help/images/contrast-adjustment_ja_JP.html), 2024 年 9 月 18 日参照 コントラストの補正 補正前 補正後 [4]
15/26 インスタンスセグメンテーションとは 処理の流れ 領域分割して物体の種類を認識できる手法 2つのセグメンテーションの違い セマンティックと違い、同じクラスでも個別に抽出 利用したモデル:Mask-RCNN
16/26 処理の流れ アノテーション:芯クラスと葉クラスで区別 芯クラス:根から小ねぎの先端まで伸びている葉 葉クラス:芯から分岐している外葉 芯 クラス 葉 クラス
17/26 推論 (インスタンスセグメンテーションを実行) 処理の流れ 画像の取得 前処理 推論 分岐部位置の判別 y座標の出力 Mask-RCNNにより
葉と芯のインスタンス領域を推論 物体のバウンディングボックスを取得
18/26 葉の位置と枚数から分岐部位置を推定 分岐部位置の判別と出力 画像の取得 前処理 推論 分岐部位置の判別 y座標の出力 葉の枚数が変わっている箇所が 分岐部であると推定して出力
最上位分岐部 (このy座標を出力) 第2分岐部 3 2 1
19/26 発表内容
20/26 本実験の目的 推論処理を認識精度(正解率*)の観点で性能評価 物体検出モデル(YOLOX)と比較 葉の位置から分岐部を推定する手法の 検出精度と分岐部の遮蔽に対する有効性の評価 * 正解位置との差が1cm未満を検出成功とする 出力y座標と正解y座標の差が50px未満であれば正解 上下誤差
1.0cm 正解位置
21/26 評価方法 K-分割交差検証 (K = 10) 目的:テストデータセットの偏りによる精度の影響を防ぐため … テストデータ 学習データ
430枚のデータを10分割 1つ(43枚)をテストデータ 残り(387枚)を学習データ 10回実験を実施して 全ての画像について評価 430 枚 1 2 10 43枚
22/26 実験 (2つの実験により本手法の有効性を評価) 02 分岐部が遮蔽された画像で評価 01 すべての小ねぎ画像で評価 小ねぎデータセット430枚すべての画像に対して 正解率を評価(分岐部が遮蔽された画像も含む) 430枚のなかで、分岐部が遮蔽されていると判断した
39枚のうち正解率を評価
23/26 実験結果 すべての小ねぎ画像(遮蔽を含む)と遮蔽画像の評価 全ての画像を評価すると精度はYOLOXの推論が上回る 一方で、分岐部が遮蔽した場合ではMask-RCNNが大幅に上回る 89 72 0 20 40
60 80 100 YOLOX Mask-RCNN 正解率 [%] 実験1:すべての画像(430枚)の評価 38 89 0 20 40 60 80 100 YOLOX Mask-RCNN 正解率 [%] 実験2:分岐部が遮蔽した画像(39枚)の評価 2.34 倍
24/26 提案手法の有効性について 葉が見えていれば推定可能 分岐部が遮蔽されていても葉を個体ごとに認識することが できれば分岐部位置を推定可能 ただし全体の精度は物体検出モデルに劣る そのため現時点では実応用は不可 成功例
25/26 発表内容
26/26 まとめ インスタンスセグメンテーションにより葉の位置を抽出して 葉の形状から分岐部を推定する手法を提案 分岐部が遮蔽された場合の検出率は 89% & YOLOXの約2.34倍 分岐部が遮蔽された場合の検出の有効性を確認 分岐部が遮蔽されていない場合の精度の向上
物体検出モデルと組み合わせた検出手法の検討 今後の課題
appendix
28/26 Mask-RCNN Faster-RCNNをセグメンテーション向けに拡張したモデル 物体検出(Faster-RCNN)+セグメンテーション機能 物体検出結果として得られた領域に対してセグメンテーション 2ステップで推論を実行 Object detection task Segmentation
task
29/26 Detectron2 Meta Research が提供するモデル作成用ライブラリ 物体検出やセグメンテーションモデルを作成可能 Apache 2.0 ライセンスで商用利用も可 事前に学習されたResNet-50を転移学習
30/26 実験環境 CPU Intel(R) Core(TM) i5-11400 GPU NVIDIA GeForce RTX-3060
OS Ubuntu 20.04 プログラミング言語 Python 3.11.4
31/26 データセット 大分県宇佐市北部小ねぎ共同調製場にて 調製される小ねぎを撮影した430枚の画像 撮影位置は固定 解像度 : 1920 x 1080
32/26 検出可否の基準 出力y座標と正解y座標を比較 正解位置との差が1cm未満を検出成功とする 出力y座標と正解y座標の差が50px未満であれば正解 上下誤差 1.0cm 正解位置