Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Mambaで物体検出 完全に理解した
Search
Reiki Shirasawa
July 29, 2025
Technology
710
2
Share
Mambaで物体検出 完全に理解した
「エンジニア達の「完全に理解した」Talk #67」(
https://easy2.connpass.com/event/360405/
)にて発表させていただきました。
Reiki Shirasawa
July 29, 2025
Other Decks in Technology
See All in Technology
LLM時代の検索アーキテクチャと技術的意思決定
shibuiwilliam
2
730
AI時代における技術的負債への取り組み
codenote
0
1.1k
60分で学ぶ最新Webフロントエンド
mizdra
PRO
33
17k
JEDAI in Osaka 2026イントロ
taka_aki
0
240
最初の一歩を踏み出せなかった私が、誰かの背中を押したいと思うようになるまで / give someone a push
mii3king
0
150
2026年、知っておくべき最新 サーバレスTips10選/serverless-10-tips
slsops
13
5k
3つのボトルネックを解消し、リリースエンジニアリングを再定義した話
nealle
0
520
AI駆動1on1〜AIに自分を育ててもらう〜
yoshiakiyasuda
0
110
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
3k
システムは「動く」だけでは足りない 実装編 - 非機能要件・分散システム・トレードオフをコードで見る
nwiizo
4
400
こんなアーキテクチャ図はいやだ / Anti-pattern in AWS Architecture Diagrams
naospon
1
400
Azure PortalなどにみるWebアクセシビリティ
tomokusaba
0
370
Featured
See All Featured
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
480
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.4k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
170
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
64
54k
The Cult of Friendly URLs
andyhume
79
6.8k
The Pragmatic Product Professional
lauravandoore
37
7.2k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
110
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
790
Transcript
次世代のアーキテクチャ? Mambaで物体検出 完全に理解した Reiki Shirasawa エンジニア達の「完全に理解した」Talk #67 2025年7 月
29 日
自己 紹介 株式会社TechSword 製造領域の ノーコードAIプラットフォーム - エッジAI - 物体検出AI Reiki
Shirasawa @reikishirasawa
今 日 話す内容 - ふんわりした Mambaって何?なんで 生 まれたの? - ふんわりした
Mambaの画像認識(物体検出)分野への適 用 事例
世はTransformer時代 主要な 大 規模 言 語モデルは Transformer がベースになっている
画像認識の分野でも - DETR( 2 0 2 0 ) Transformer ×
物体検出の先駆け - Swin Transformer(2021) 軽量と 高 精度を両 立 したい - SAM(2023) ゼロショットでセグメンテーション
アーキテクチャの変遷 CNN Transformer ?
Transformerの課題 計算量 大 きくなりがち , はトークン 長 に関連 の計算が発 生
してしまう Q K N O(N2) Attention(Q, K, V) = softmax( QKT dk )V
もっと効率的に! でっかいコンテキスト 入 れたい
Mamba
ここがすごいぞMamba Mamba( 2 0 2 3 ) - 計算量が線形 にスケール
- 同サイズのTransformerの5倍速 O(N)
Mambaってどんなやつ? SSM(構造化状態空間モデル)を発展させたもの
SSMってどんなやつ? SSMの基本式 ht = ¯ Aht−1 + ¯ Bxt yt
= Cht 入力 とひとつ前の状態から 出 力 を決める
SSMの課題 必要な情報を選択する 力 が弱い Transformerの強みだった → 入力 の重要度がわからず全てフラットに 見 てしまう
Mambaの概要 入力 に応じてパラメータを変化させ どのくらい状態に反映させるかを決定 → 重要な部分に注 目 できない弱点を克服! 出典:https://arxiv.org/pdf/2312.00752
LLMにもMamba Codestral Mamba( 2 0 2 4 ) Mistral AI
- より 長 いコンテキスト 長 - より速い応答時間 https://mistral.ai/news/codestral-mamba
画像認識にもMamba Mamba YOLO( 2 0 2 4 ) - Mambaで物体検出してみた
- 画像の局所特徴を捉える 工 夫 - COCOデータセットでSOTA 出典:https://arxiv.org/pdf/2406.05835
物体検出にもMamba MambaNeXt-YOLO( 2 0 2 5 ) - CNNとのハイブリッド -
CNN:局所特徴得意 - Mamba: 長 距離依存得意 - リアルタイム ・ 低リソースな 環境で活躍するぞ! 出典:https://arxiv.org/pdf/2506.03654
まとめ - Mamba が画像認識(物体検出)の分野でも注 目 - これから普及が進んでいったら 面白 いね