Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Mambaで物体検出 完全に理解した
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Reiki Shirasawa
July 29, 2025
Technology
810
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Mambaで物体検出 完全に理解した
「エンジニア達の「完全に理解した」Talk #67」(
https://easy2.connpass.com/event/360405/
)にて発表させていただきました。
Reiki Shirasawa
July 29, 2025
Other Decks in Technology
See All in Technology
FinOps × AIエージェントで実現する コストインシデントの自動調査
oasis1994liveforever
0
150
200個のGitHubリポジトリを横断調査したかった
icck
0
130
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
4
680
LayerX コーポレートエンジニアリング室におけるサプライチェーンセキュリティへの取り組み / Supply Chain Security at LayerX Corporate Engineering
yuyatakeyama
2
590
フィジカル版Github Onshapeの紹介
shiba_8ro
0
260
LLMにもCAP定理があるという話
harukasakihara
0
380
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
260
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
110
20260619 私の日常業務での生成 AI 活用
masaruogura
1
220
アジャイルな経理と Claude Code と経営の未来
kawaguti
PRO
3
130
小さく始める AI 活用推進 ― 日経電子版 Web チームの事例/nikkei-tech-talk47
nikkei_engineer_recruiting
0
270
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
350
Featured
See All Featured
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
The B2B funnel & how to create a winning content strategy
katarinadahlin
PRO
1
390
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
230
[SF Ruby Conf 2025] Rails X
palkan
2
1.1k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
The Language of Interfaces
destraynor
162
27k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
230
30 Presentation Tips
portentint
PRO
1
320
SEO for Brand Visibility & Recognition
aleyda
0
4.6k
Odyssey Design
rkendrick25
PRO
2
700
Transcript
次世代のアーキテクチャ? Mambaで物体検出 完全に理解した Reiki Shirasawa エンジニア達の「完全に理解した」Talk #67 2025年7 月
29 日
自己 紹介 株式会社TechSword 製造領域の ノーコードAIプラットフォーム - エッジAI - 物体検出AI Reiki
Shirasawa @reikishirasawa
今 日 話す内容 - ふんわりした Mambaって何?なんで 生 まれたの? - ふんわりした
Mambaの画像認識(物体検出)分野への適 用 事例
世はTransformer時代 主要な 大 規模 言 語モデルは Transformer がベースになっている
画像認識の分野でも - DETR( 2 0 2 0 ) Transformer ×
物体検出の先駆け - Swin Transformer(2021) 軽量と 高 精度を両 立 したい - SAM(2023) ゼロショットでセグメンテーション
アーキテクチャの変遷 CNN Transformer ?
Transformerの課題 計算量 大 きくなりがち , はトークン 長 に関連 の計算が発 生
してしまう Q K N O(N2) Attention(Q, K, V) = softmax( QKT dk )V
もっと効率的に! でっかいコンテキスト 入 れたい
Mamba
ここがすごいぞMamba Mamba( 2 0 2 3 ) - 計算量が線形 にスケール
- 同サイズのTransformerの5倍速 O(N)
Mambaってどんなやつ? SSM(構造化状態空間モデル)を発展させたもの
SSMってどんなやつ? SSMの基本式 ht = ¯ Aht−1 + ¯ Bxt yt
= Cht 入力 とひとつ前の状態から 出 力 を決める
SSMの課題 必要な情報を選択する 力 が弱い Transformerの強みだった → 入力 の重要度がわからず全てフラットに 見 てしまう
Mambaの概要 入力 に応じてパラメータを変化させ どのくらい状態に反映させるかを決定 → 重要な部分に注 目 できない弱点を克服! 出典:https://arxiv.org/pdf/2312.00752
LLMにもMamba Codestral Mamba( 2 0 2 4 ) Mistral AI
- より 長 いコンテキスト 長 - より速い応答時間 https://mistral.ai/news/codestral-mamba
画像認識にもMamba Mamba YOLO( 2 0 2 4 ) - Mambaで物体検出してみた
- 画像の局所特徴を捉える 工 夫 - COCOデータセットでSOTA 出典:https://arxiv.org/pdf/2406.05835
物体検出にもMamba MambaNeXt-YOLO( 2 0 2 5 ) - CNNとのハイブリッド -
CNN:局所特徴得意 - Mamba: 長 距離依存得意 - リアルタイム ・ 低リソースな 環境で活躍するぞ! 出典:https://arxiv.org/pdf/2506.03654
まとめ - Mamba が画像認識(物体検出)の分野でも注 目 - これから普及が進んでいったら 面白 いね