Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
NobuakiOshiro
PRO
July 10, 2025
Technology
1
97
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
Tweet
Share
More Decks by NobuakiOshiro
See All by NobuakiOshiro
[NotebookLM製]20251210_AIによる前処理について
doradora09
PRO
0
5
20251122_第1回ローカルLLMなんでも勉強会_オープニングトーク
doradora09
PRO
0
100
20251122_LT_スマホ版軽量ローカルLLMで人物名マスク
doradora09
PRO
0
97
20251120_LT_AIで今年の漢字を予想する
doradora09
PRO
0
42
20251120_生成AI(LLM)で自習する方法とバイブコーディング入門
doradora09
PRO
0
17
20251025_LT_catgpt_atlasでわかるOpenAI歴
doradora09
PRO
0
42
20251015_LT_BIのAIがAGI過渡期は流行るのではと思った話
doradora09
PRO
0
17
20251015_第4回_GenAIアナリティクス勉強会at東京_オープニングトーク
doradora09
PRO
0
5
20251011_第75回ChatGPT部_オープニングトーク_v1.00
doradora09
PRO
0
59
Other Decks in Technology
See All in Technology
エンジニアとPMのドメイン知識の溝をなくす、 AIネイティブな開発プロセス
applism118
4
1.2k
AWS Trainium3 をちょっと身近に感じたい
bigmuramura
1
140
学習データって増やせばいいんですか?
ftakahashi
2
320
Microsoft Agent 365 についてゆっくりじっくり理解する!
skmkzyk
0
250
Playwright x GitHub Actionsで実現する「レビューしやすい」E2Eテストレポート
kinosuke01
0
590
プロンプトやエージェントを自動的に作る方法
shibuiwilliam
0
1.1k
ガバメントクラウド利用システムのライフサイクルについて
techniczna
0
190
Challenging Hardware Contests with Zephyr and Lessons Learned
iotengineer22
0
190
生成AIでテスト設計はどこまでできる? 「テスト粒度」を操るテーラリング術
shota_kusaba
0
710
今からでも間に合う!速習Devin入門とその活用方法
ismk
1
670
今年のデータ・ML系アップデートと気になるアプデのご紹介
nayuts
1
310
OCI Oracle Database Services新機能アップデート(2025/09-2025/11)
oracle4engineer
PRO
1
130
Featured
See All Featured
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
7.9k
The Cult of Friendly URLs
andyhume
79
6.7k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
Raft: Consensus for Rubyists
vanstee
141
7.2k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.3k
Code Reviewing Like a Champion
maltzj
527
40k
Side Projects
sachag
455
43k
The Pragmatic Product Professional
lauravandoore
37
7.1k
Building Applications with DynamoDB
mza
96
6.8k
How STYLIGHT went responsive
nonsquared
100
6k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.6k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!