Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ローカルLLM
Search
NearMeの技術発表資料です
PRO
November 07, 2025
0
33
ローカルLLM
NearMeの技術発表資料です
PRO
November 07, 2025
Tweet
Share
More Decks by NearMeの技術発表資料です
See All by NearMeの技術発表資料です
ローカルLLMを⽤いてコード補完を⾏う VSCode拡張機能を作ってみた
nearme_tech
PRO
0
94
初めてのmarimo (ハンズオン)
nearme_tech
PRO
0
19
LlamaIndex Workflow: Build Practical AI Agents Fast
nearme_tech
PRO
0
20
Box-Muller法
nearme_tech
PRO
1
35
Kiro触ってみた
nearme_tech
PRO
0
260
今だからこそ入門する Server-Sent Events (SSE)
nearme_tech
PRO
4
530
ReactNative のアップグレード作業が (意外に)楽しかった話
nearme_tech
PRO
2
130
強化学習アルゴリズムPPOの改善案を考えてみた
nearme_tech
PRO
0
81
Apple Containerについて調べて触ってみた
nearme_tech
PRO
1
890
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
34
9k
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.1k
The Pragmatic Product Professional
lauravandoore
37
7.1k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.6k
Music & Morning Musume
bryan
46
7k
Designing for humans not robots
tammielis
254
26k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Designing for Performance
lara
610
69k
How STYLIGHT went responsive
nonsquared
100
6k
GraphQLとの向き合い方2022年版
quramy
50
14k
Bash Introduction
62gerente
615
210k
Agile that works and the tools we love
rasmusluckow
331
21k
Transcript
0 ローカルLLM 2025-11-06 第134回NearMe技術勉強会 Takuma KAKINOUE
1 LLMをローカルで動かしたい • 楽にできる⽅法はないか? → Ollamaを使ってみよう!(https://ollama.com/) • どのモデルを動かそう? ◦ https://ollama.com/search
◦ gpt-ossが気になったのでgpt-oss:20bを動かしてみる
2 動かし⽅ • ollama pull gpt-oss:20b • ollama run gpt-oss:20b
3 環境 • Windows11 • GPU:RTX5070Ti(VRAM:16GB)
4 動かしてみた結果 約12秒で完全な出⼒が得られた! AIからの返答は、「前提知識があれば理解できる が、⼩学⽣が理解するのは難しそう」といった 感じ..
5 Mac(M2 Pro)でも試してみた • brew install ollama • ollama serve
• ollama pull gpt-oss:20b • ollama run gpt-oss:20b 同じ質問をしたら、完全な出⼒が得られるのに約43秒かかった → 5070tiより遅いが実⽤的なレベル ※出⼒の内容は若⼲異なったが(⻑さは同程度)、質はどっこいどっこい
6 本家ChatGPT(無課⾦版)では 28秒かかったが、 内容は⼀番わかりやす かった! (モデルはOSS版と異な る模様)
7 結果 • local(RTX5070Ti) ◦ 処理時間:約12秒、出⼒精度:普通 • local(Mac M2 Pro)
◦ 処理時間:約43秒、出⼒精度:普通 • 無課⾦版ChatGPT ◦ 処理時間:約28秒、出⼒精度:良い
8 コーディングもやらせてみた結果(local: Mac M2 Pro) > FizzBuzz問題を解くコードをPythonで書いて。
9 今後の展望 • Toolsなどを使って⾃作コーディングエージェントを作ってみる (余談) DGX Sparkほしい..! https://www.nvidia.com/ja-jp/products/workstations/dgx-spark/
10 Thank you