Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20250709_MacStudioとLlama-4Maverickでローカル画像認識
Search
NobuakiOshiro
PRO
July 10, 2025
Technology
140
1
Share
20250709_MacStudioとLlama-4Maverickでローカル画像認識
https://genaianalyticstokyo.connpass.com/event/357598/
NobuakiOshiro
PRO
July 10, 2025
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20260404_3年W封鎖ケースシミュレーション_サマリとレビュー付き
doradora09
PRO
0
10
20260404_4つのLLMでのイラン情勢予測_統合版_レビュー付き
doradora09
PRO
0
12
20260404_医療関係へのイラン情勢への影響モニタリング_レビュー付き
doradora09
PRO
0
47
20260403_(簡易)AI欠品予測レポートの作り方_大城.pdf
doradora09
PRO
0
34
20260329_修正版_v2b_バブ・エル・マンデブ海峡封鎖リスクと日本のナフサ危機_AIシナリオ予測_AIレビュー付
doradora09
PRO
0
39
20260328_LT_花見会場をAIで探す
doradora09
PRO
0
63
20260328_中東情勢の2日差分_サマリ+レビュー付き
doradora09
PRO
0
40
20260326_中東情勢の1日差分+レビュー付き
doradora09
PRO
0
23
20260325_イラン情勢推移モニタリング
doradora09
PRO
0
31
Other Decks in Technology
See All in Technology
SaaSの操作主体は人間からAIへ - 経理AIエージェントが目指す深い自動化
nishihira
0
130
「できない」のアウトプット 同人誌『精神を壊してからの』シリーズ出版を 通して得られたこと
comi190327
3
440
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
3
2k
Sansanの認証基盤を支えるアーキテクチャとその振り返り
sansantech
PRO
1
120
Navigation APIと見るSvelteKitのWeb標準志向
yamanoku
2
130
私がよく使うMCPサーバー3選と社内で安全に活用する方法
kintotechdev
0
150
GitHub Copilot CLI で Azure Portal to Bicep
tsubakimoto_s
0
300
LLMに何を任せ、何を任せないか
cap120
11
6.7k
Microsoft Fabricで考える非構造データのAI活用
ryomaru0825
0
550
OCI技術資料 : ロード・バランサ 概要 - FLB・NLB共通
ocise
4
27k
スケーリングを封じられたEC2を救いたい
senseofunity129
0
130
GitHub Actions侵害 — 相次ぐ事例を振り返り、次なる脅威に備える
flatt_security
11
6.9k
Featured
See All Featured
Designing for Performance
lara
611
70k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
870
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
210
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
920
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.8k
Darren the Foodie - Storyboard
khoart
PRO
3
3.1k
Abbi's Birthday
coloredviolet
2
6.1k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
300
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
260
Game over? The fight for quality and originality in the time of robots
wayneb77
1
150
Transcript
Mac Studio 512GB x Llama-4 maverickで ローカル画像認識 2025/7/9 ⼤城 信晃
ChatGPT-4Visionの頃のこちらの論⽂ • 2023年10⽉ごろに MSから出た検証論 ⽂ • 今回はそれをローカ ルLLMでどれくらい 再現できるか試して みたいと思います
( 抜粋しつつ検証 ) • https://arxiv.org/abs/2309.17421
Mac Studio 512GB x Llama-4 maveric
LM Studio上でLlama-4を動かして 画像とプロンプトを セットに⼊れて性能検証
トマト個数判定 (△) 初回は5個でNG リテイクさせると6個で正解
ID認識(◦) (たまにミス)
図形類推(◎) (ノーヒント⼀発なので4Vより良い)
リンゴ個数判定 (△) (リテイクで正解)
ポイント判定(◦)
アナログメーター判定(×) (one-shotもNG)
料理判定(◦)(検索なし)
⾻折判定(◦)
ドラレコ判定(◎)
⾷物連鎖 判定(◦)
プロファイリング(△)
⽂字判定(◦)
⼿書き⽂字判定(◦)
⼿順判定(◦)
アスキーアート 判定(×)
表情認識(◦)
間違い探し(△)
ヘルメット検出(◎)
バスケット判定(△)
事故⾞レポート(◦)
家族認識(◦) (リンダは読み間違え)
ロボット視点(△) (リビングルームはどこ? )
まとめ • カウント系はやや弱い印象 • 図形判定やドラレコ認識などはGPT-4Vよりも良い結果 • 全体として、Llama-4 MavericならGPT-4Vと遜⾊のないレベ ル ->
ローカルLLMでガンガン画像解析ができますね・・!!
Enjoy..!!