Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
NobuakiOshiro
PRO
July 10, 2025
Technology
1
55
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250823_LT_爆速AI_Cerebrasから考える未来
doradora09
PRO
0
15
20250726_DeepResearchで何かしらの情報を調べた後のTips
doradora09
PRO
1
48
20250718_分析業務への生成AI活用(テキストマイニングを例題に)
doradora09
PRO
1
80
20250715_AI時代到来・企業リスクへの生成AI活用術
doradora09
PRO
0
67
20250709_第3回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
79
20250625_生成 AI 活用2年目の壁を突破せよ_(60min版)
doradora09
PRO
0
54
20250628_生成AIおすすめyoutube共有会_ChatGPT部第69回
doradora09
PRO
0
69
20250614_LT_走れメロスの個人情報マスク処理をMacStudio 512GBメモリマシンで試してみた
doradora09
PRO
1
12
20250607_AIから始めるロボット勉強会_HuggingFaceについて
doradora09
PRO
0
27
Other Decks in Technology
See All in Technology
Cloud WANの基礎から応用~少しだけDeep Dive~
masakiokuda
3
120
AI時代の大規模データ活用とセキュリティ戦略
ken5scal
1
260
Oracle Exadata Database Service on Cloud@Customer X11M (ExaDB-C@C) サービス概要
oracle4engineer
PRO
2
6.4k
Observability for LLM Application lifecycle
ivry_presentationmaterials
0
110
テストを実行してSorbetのsigを書こう!
sansantech
PRO
1
130
家族の思い出を形にする 〜 1秒動画の生成を支えるインフラアーキテクチャ
ojima_h
3
1.4k
Intro to Software Startups: Spring 2025
arnabdotorg
0
280
Backlog AI アシスタントが切り開く未来
vvatanabe
1
170
Amazon GuardDuty での脅威検出:脅威検出の実例から学ぶ
kintotechdev
0
130
アカデミーキャンプ 2025 SuuuuuuMMeR「燃えろ!!ロボコン」 / Academy Camp 2025 SuuuuuuMMeR "Burn the Spirit, Robocon!!" DAY 1
ks91
PRO
0
150
プロダクトエンジニアリングで開発の楽しさを拡張する話
barometrica
0
210
あとはAIに任せて人間は自由に生きる
kentaro
3
650
Featured
See All Featured
Being A Developer After 40
akosma
90
590k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.6k
Visualization
eitanlees
146
16k
A designer walks into a library…
pauljervisheath
207
24k
Balancing Empowerment & Direction
lara
2
570
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
50k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
810
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
890
How to train your dragon (web standard)
notwaldorf
96
6.2k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
36
2.5k
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!