Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DeepSeek-R1:最新の大規模言語モデル
Search
stoneweb
February 02, 2025
Technology
0
160
DeepSeek-R1:最新の大規模言語モデル
stoneweb
February 02, 2025
Tweet
Share
More Decks by stoneweb
See All by stoneweb
ChatGPTのプロンプトの基本的な書き方
stoneweb
1
360
ChatGPTを業務に活用する具体例
stoneweb
0
130
ChatGPTのAIエージェント「Operator」について
stoneweb
0
120
Perplexityのスペースを使って簡単にAIクローンを作る方法
stoneweb
0
210
ChatGPTで作成した記事をPerplexity・Felo・Grokでファクトチェックする方法
stoneweb
0
420
ChatGPTとは
stoneweb
0
170
Other Decks in Technology
See All in Technology
It’s “Time” to use Temporal
sajikix
3
220
[JAWSDAYS2026]Who is responsible for IAM
mizukibbb
0
910
Claude Code 2026年 最新アップデート
oikon48
14
11k
ReactのdangerouslySetInnerHTMLは“dangerously”だから危険 / Security.any #09 卒業したいセキュリティLT
flatt_security
0
320
20260321_エンベディングってなに?RAGってなに?エンベディングの説明とGemini Embedding 2 の紹介
tsho
0
100
OpenClaw を Amazon Lightsail で動かす理由
uechishingo
0
200
「通るまでRe-run」から卒業!落ちないテストを書く勘所
asumikam
2
210
VLAモデル構築のための AIロボット向け模倣学習キット
kmatsuiugo
0
260
Everything Claude Code を眺める
oikon48
13
7.9k
Claude Code Skills 勉強会 (DevelersIO向けに調整済み) / claude code skills for devio
masahirokawahara
1
22k
【Λ(らむだ)】最近のアプデ情報 / RPALT20260318
lambda
0
110
最強のAIエージェントを諦めたら品質が上がった話 / how quality improved after giving up on the strongest AI agent
kt2mikan
0
200
Featured
See All Featured
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
150
The agentic SEO stack - context over prompts
schlessera
0
700
The Limits of Empathy - UXLibs8
cassininazir
1
270
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
320
A Modern Web Designer's Workflow
chriscoyier
698
190k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
75
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
490
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
450
How to make the Groovebox
asonas
2
2k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Transcript
DeepSeek-R1: 最新の⼤規模 ⾔語ムヅラ DeepSeek-R1は、中国のAI企業DeepSeekによって開発された最新の⼤規模 ⾔語ムヅラ(LLM)で、2025年1⽉20⽇にエヺフヱセヺシとして公開されま した。このムヅラは、特に推論能⼒に特化しており、OpenAIのo1ムヅラと 同等、またはそれ以上の性能を持つとされています。DeepSeek-R1は、商 業利⽤を含む⾃由な利⽤が可能なMITョアスヱシのもとで提供されていま す。
主な特徴 エヺフヱセヺシ MITョアスヱシにより、開発者はムヅラを⾃由にォシソボ アジし、商業利⽤も可能です。 ⾼い推論能⼒ 数学的問題解決やフルギョポヱギ⽀援など、論理的思考を 要するソシキにおいて⾼精度な結果を⽰します。具体的に は、数学プヱタボヺキ「MATH-500」で97.3%の正解率を 記録し、フルギョポヱギ競技コアテ「Codeforces」では 96.3ハヺスヱソアラを達成しています。
強化学習の活⽤ DeepSeek-R1は、強化学習を⽤いた⾃律的な学習を⾏ い、さらに⾼品質なヅヺソを⽤いたビゟアヱタャヺドヱギ も⾏っています。この゠フルヺタにより、ムヅラは複雑な 問題解決能⼒を獲得し、特に数学やフルギョポヱギの分野 で優れた性能を発揮します。 ⼤規模ケヱツカシテ対応 最⼤128Kテヺキヱの⼊⼒を処理できるため、⻑⽂のデカ ャミヱテや⻑時間の会話においても⼀貫性のある応答を⽣ 成できます。
性能とベンチマーク 数学的推論 AIME 2024で79.8%のスコアを達成 し、MATH-500では97.3%の正解率 を記録しています。 プログラミング能⼒ Codeforcesで2029という⾼レーテ ィングを獲得し、プログラミング関 連のタスクに最適です。
総合的な知識理解⼒ MMLUテストで90.8%のスコアを達 成し、さまざまな知識を問うタスク においても⾼い性能を⽰していま す。
ケシテと利⽤⽅法 ⼊⼒テヺキヱ カメチサャバチテ時は$0.14/百万テヺキヱ、カメチサャポ シ時は$0.55/百万テヺキヱ。 出⼒テヺキヱ $2.19/百万テヺキヱ。 このように、DeepSeek-R1は⾼性能でありながら、ケシテハビェヺボヱシにも優れたムヅラです。
注意点 ヅヺソ保護に関する懸念 中国企業が開発したムヅラであるため、⼀部の利⽤者はヅヺソ 保護に関する懸念を抱いています。API経由で⼊⼒したヅヺソ が学習ヅヺソとして使⽤される可能性があるため、機密情報を 扱う際には注意が必要です。 特定の制約 台湾や中国政府に関連する質問では特定の制約が確認されてい ます。
まとめ DeepSeek-R1は、エヺフヱセヺシでありながら⾼い推論能⼒を持つ⼤規模 ⾔語ムヅラで、特に数学やフルギョポヱギの分野での応⽤が期待されていま す。強化学習を活⽤した⾃律的な学習フルスシにより、従枈のムヅラに⽐べ て優れた性能を発揮しています。商業利⽤が可能で、ケシテ効率も⾼いた め、研究機関や企業にとっても魅⼒的な選択肢となるでしょう。
STONEWEB 合同会社ストーンウェブ 経営者の「困った」にワンストップで応える!幅広い実務経験と経営視点をあわせ持つパートナーとして、WebサイトやSNS運⽤ はもちろん、採⽤やブランディングなど複数の課題を⼀括サポート。 余計なやり取りやコストを抑えながら、経営者の意思決定と 戦略⽴案に集中できる環境を整えます。 ご相談はこちら