Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DeepSeek-R1:最新の大規模言語モデル
Search
stoneweb
February 02, 2025
Technology
180
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
DeepSeek-R1:最新の大規模言語モデル
stoneweb
February 02, 2025
More Decks by stoneweb
See All by stoneweb
ChatGPTのプロンプトの基本的な書き方
stoneweb
1
370
ChatGPTを業務に活用する具体例
stoneweb
0
140
ChatGPTのAIエージェント「Operator」について
stoneweb
0
130
Perplexityのスペースを使って簡単にAIクローンを作る方法
stoneweb
0
230
ChatGPTで作成した記事をPerplexity・Felo・Grokでファクトチェックする方法
stoneweb
0
430
ChatGPTとは
stoneweb
0
170
Other Decks in Technology
See All in Technology
PostgreSQL 19 新機能概要 OSC Hokkaido 2026
nori_shinoda
0
260
Fabricをフル活用する AI Agent Hub -製造業特化AIエージェントの設計
iotcomjpadmin
0
160
AIは、人間らしい仕事の夢を見るか?─ AI時代のtoB/toEプロダクトを再設計する
techtekt
PRO
0
160
Lightning近況報告
kozy4324
0
230
5分でわかるDuckDB Quack
chanyou0311
4
270
「ビジネスがわかるエンジニア」とは何か?
ryooob
0
350
打造你的 AI 工作流:Agent Skill + MCP 實戰工作坊
appleboy
0
160
初めてのDatabricks勉強会
taka_aki
2
190
脱SaaS!FDEを支えるプロビジョニングと分離設計
knih
0
300
トークン最適化のためのユーザーストーリー分析 / User Story Analysis for Token Optimization
oomatomo
0
130
クレデンシャル流出 ― 攻撃 3 時間 vs 復旧 10 時間。この非対称性にどう備えるか
kazzpapa3
3
620
從觀望到全公司落地:AI Agentic Coding 導入實戰 — 流程整合與安全治理
appleboy
0
160
Featured
See All Featured
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
980
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
260
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
440
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
Navigating Team Friction
lara
192
16k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
210
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.7k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
Testing 201, or: Great Expectations
jmmastey
46
8.2k
Transcript
DeepSeek-R1: 最新の⼤規模 ⾔語ムヅラ DeepSeek-R1は、中国のAI企業DeepSeekによって開発された最新の⼤規模 ⾔語ムヅラ(LLM)で、2025年1⽉20⽇にエヺフヱセヺシとして公開されま した。このムヅラは、特に推論能⼒に特化しており、OpenAIのo1ムヅラと 同等、またはそれ以上の性能を持つとされています。DeepSeek-R1は、商 業利⽤を含む⾃由な利⽤が可能なMITョアスヱシのもとで提供されていま す。
主な特徴 エヺフヱセヺシ MITョアスヱシにより、開発者はムヅラを⾃由にォシソボ アジし、商業利⽤も可能です。 ⾼い推論能⼒ 数学的問題解決やフルギョポヱギ⽀援など、論理的思考を 要するソシキにおいて⾼精度な結果を⽰します。具体的に は、数学プヱタボヺキ「MATH-500」で97.3%の正解率を 記録し、フルギョポヱギ競技コアテ「Codeforces」では 96.3ハヺスヱソアラを達成しています。
強化学習の活⽤ DeepSeek-R1は、強化学習を⽤いた⾃律的な学習を⾏ い、さらに⾼品質なヅヺソを⽤いたビゟアヱタャヺドヱギ も⾏っています。この゠フルヺタにより、ムヅラは複雑な 問題解決能⼒を獲得し、特に数学やフルギョポヱギの分野 で優れた性能を発揮します。 ⼤規模ケヱツカシテ対応 最⼤128Kテヺキヱの⼊⼒を処理できるため、⻑⽂のデカ ャミヱテや⻑時間の会話においても⼀貫性のある応答を⽣ 成できます。
性能とベンチマーク 数学的推論 AIME 2024で79.8%のスコアを達成 し、MATH-500では97.3%の正解率 を記録しています。 プログラミング能⼒ Codeforcesで2029という⾼レーテ ィングを獲得し、プログラミング関 連のタスクに最適です。
総合的な知識理解⼒ MMLUテストで90.8%のスコアを達 成し、さまざまな知識を問うタスク においても⾼い性能を⽰していま す。
ケシテと利⽤⽅法 ⼊⼒テヺキヱ カメチサャバチテ時は$0.14/百万テヺキヱ、カメチサャポ シ時は$0.55/百万テヺキヱ。 出⼒テヺキヱ $2.19/百万テヺキヱ。 このように、DeepSeek-R1は⾼性能でありながら、ケシテハビェヺボヱシにも優れたムヅラです。
注意点 ヅヺソ保護に関する懸念 中国企業が開発したムヅラであるため、⼀部の利⽤者はヅヺソ 保護に関する懸念を抱いています。API経由で⼊⼒したヅヺソ が学習ヅヺソとして使⽤される可能性があるため、機密情報を 扱う際には注意が必要です。 特定の制約 台湾や中国政府に関連する質問では特定の制約が確認されてい ます。
まとめ DeepSeek-R1は、エヺフヱセヺシでありながら⾼い推論能⼒を持つ⼤規模 ⾔語ムヅラで、特に数学やフルギョポヱギの分野での応⽤が期待されていま す。強化学習を活⽤した⾃律的な学習フルスシにより、従枈のムヅラに⽐べ て優れた性能を発揮しています。商業利⽤が可能で、ケシテ効率も⾼いた め、研究機関や企業にとっても魅⼒的な選択肢となるでしょう。
STONEWEB 合同会社ストーンウェブ 経営者の「困った」にワンストップで応える!幅広い実務経験と経営視点をあわせ持つパートナーとして、WebサイトやSNS運⽤ はもちろん、採⽤やブランディングなど複数の課題を⼀括サポート。 余計なやり取りやコストを抑えながら、経営者の意思決定と 戦略⽴案に集中できる環境を整えます。 ご相談はこちら