Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Mambaで物体検出 完全に理解した
Search
Reiki Shirasawa
July 29, 2025
Technology
2
390
Mambaで物体検出 完全に理解した
「エンジニア達の「完全に理解した」Talk #67」(
https://easy2.connpass.com/event/360405/
)にて発表させていただきました。
Reiki Shirasawa
July 29, 2025
Tweet
Share
Other Decks in Technology
See All in Technology
会社を支える Pythonという言語戦略 ~なぜPythonを主要言語にしているのか?~
curekoshimizu
4
910
AIを使ってテストを楽にする
kworkdev
PRO
0
280
SOTA競争から人間を超える画像認識へ
shinya7y
0
620
GraphRAG グラフDBを使ったLLM生成(自作漫画DBを用いた具体例を用いて)
seaturt1e
1
160
AI機能プロジェクト炎上の 3つのしくじりと学び
nakawai
0
160
オブザーバビリティが育むシステム理解と好奇心
maruloop
3
1.6k
ストレージエンジニアの仕事と、近年の計算機について / 第58回 情報科学若手の会
pfn
PRO
4
900
コンパウンド組織のCRE #cre_meetup
layerx
PRO
1
290
プレイドのユニークな技術とインターンのリアル
plaidtech
PRO
1
510
OPENLOGI Company Profile for engineer
hr01
1
46k
abema-trace-sampling-observability-cost-optimization
tetsuya28
0
370
AWS re:Invent 2025事前勉強会資料 / AWS re:Invent 2025 pre study meetup
kinunori
0
810
Featured
See All Featured
Git: the NoSQL Database
bkeepers
PRO
431
66k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Building an army of robots
kneath
306
46k
The Language of Interfaces
destraynor
162
25k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
2.9k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
31
2.7k
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
Context Engineering - Making Every Token Count
addyosmani
8
310
Designing for humans not robots
tammielis
254
26k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.2k
The World Runs on Bad Software
bkeepers
PRO
72
11k
Transcript
次世代のアーキテクチャ? Mambaで物体検出 完全に理解した Reiki Shirasawa エンジニア達の「完全に理解した」Talk #67 2025年7 月
29 日
自己 紹介 株式会社TechSword 製造領域の ノーコードAIプラットフォーム - エッジAI - 物体検出AI Reiki
Shirasawa @reikishirasawa
今 日 話す内容 - ふんわりした Mambaって何?なんで 生 まれたの? - ふんわりした
Mambaの画像認識(物体検出)分野への適 用 事例
世はTransformer時代 主要な 大 規模 言 語モデルは Transformer がベースになっている
画像認識の分野でも - DETR( 2 0 2 0 ) Transformer ×
物体検出の先駆け - Swin Transformer(2021) 軽量と 高 精度を両 立 したい - SAM(2023) ゼロショットでセグメンテーション
アーキテクチャの変遷 CNN Transformer ?
Transformerの課題 計算量 大 きくなりがち , はトークン 長 に関連 の計算が発 生
してしまう Q K N O(N2) Attention(Q, K, V) = softmax( QKT dk )V
もっと効率的に! でっかいコンテキスト 入 れたい
Mamba
ここがすごいぞMamba Mamba( 2 0 2 3 ) - 計算量が線形 にスケール
- 同サイズのTransformerの5倍速 O(N)
Mambaってどんなやつ? SSM(構造化状態空間モデル)を発展させたもの
SSMってどんなやつ? SSMの基本式 ht = ¯ Aht−1 + ¯ Bxt yt
= Cht 入力 とひとつ前の状態から 出 力 を決める
SSMの課題 必要な情報を選択する 力 が弱い Transformerの強みだった → 入力 の重要度がわからず全てフラットに 見 てしまう
Mambaの概要 入力 に応じてパラメータを変化させ どのくらい状態に反映させるかを決定 → 重要な部分に注 目 できない弱点を克服! 出典:https://arxiv.org/pdf/2312.00752
LLMにもMamba Codestral Mamba( 2 0 2 4 ) Mistral AI
- より 長 いコンテキスト 長 - より速い応答時間 https://mistral.ai/news/codestral-mamba
画像認識にもMamba Mamba YOLO( 2 0 2 4 ) - Mambaで物体検出してみた
- 画像の局所特徴を捉える 工 夫 - COCOデータセットでSOTA 出典:https://arxiv.org/pdf/2406.05835
物体検出にもMamba MambaNeXt-YOLO( 2 0 2 5 ) - CNNとのハイブリッド -
CNN:局所特徴得意 - Mamba: 長 距離依存得意 - リアルタイム ・ 低リソースな 環境で活躍するぞ! 出典:https://arxiv.org/pdf/2506.03654
まとめ - Mamba が画像認識(物体検出)の分野でも注 目 - これから普及が進んでいったら 面白 いね