Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
NobuakiOshiro
PRO
July 10, 2025
Technology
1
120
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20250110_ChatGPT部2026年の抱負
doradora09
PRO
0
91
[NotebookLM製]20251210_AIによる前処理について
doradora09
PRO
0
16
20251122_第1回ローカルLLMなんでも勉強会_オープニングトーク
doradora09
PRO
0
130
20251122_LT_スマホ版軽量ローカルLLMで人物名マスク
doradora09
PRO
0
140
20251120_LT_AIで今年の漢字を予想する
doradora09
PRO
0
71
20251120_生成AI(LLM)で自習する方法とバイブコーディング入門
doradora09
PRO
0
29
20251025_LT_catgpt_atlasでわかるOpenAI歴
doradora09
PRO
0
56
20251015_LT_BIのAIがAGI過渡期は流行るのではと思った話
doradora09
PRO
0
34
20251015_第4回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
21
Other Decks in Technology
See All in Technology
GitHub Copilot CLI を使いやすくしよう
tsubakimoto_s
0
160
Agent Skils
dip_tech
PRO
0
160
GitHub Issue Templates + Coding Agentで簡単みんなでIaC/Easy IaC for Everyone with GitHub Issue Templates + Coding Agent
aeonpeople
1
330
22nd ACRi Webinar - ChipTip Technology Eric-san's slide
nao_sumikawa
0
110
Open Table Formatにおけるストレージ抽象化の比較
lycorptech_jp
PRO
0
100
Codex 5.3 と Opus 4.6 にコーポレートサイトを作らせてみた / Codex 5.3 vs Opus 4.6
ama_ch
0
250
コミュニティが変えるキャリアの地平線:コロナ禍新卒入社のエンジニアがAWSコミュニティで見つけた成長の羅針盤
kentosuzuki
0
140
Claude_CodeでSEOを最適化する_AI_Ops_Community_Vol.2__マーケティングx_AIはここまで進化した.pdf
riku_423
2
640
プレビュー版のDevOpsエージェントを現段階で触ってみた
ad_motsu
1
150
登壇駆動学習のすすめ — CfPのネタの見つけ方と書くときに意識していること
bicstone
3
180
生成AIで始める業務改革 - 製造業編 in 福島 -
daikikanemitsu
2
470
旅先で iPad + Neovim で iOS 開発・執筆した話
zozotech
PRO
0
230
Featured
See All Featured
Darren the Foodie - Storyboard
khoart
PRO
2
2.5k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
340
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
77
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
320
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
196
71k
Testing 201, or: Great Expectations
jmmastey
46
8.1k
WCS-LA-2024
lcolladotor
0
460
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
120
It's Worth the Effort
3n
188
29k
GitHub's CSS Performance
jonrohan
1032
470k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
180
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!