Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DeepSeek-R1:最新の大規模言語モデル
Search
stoneweb
February 02, 2025
Technology
0
94
DeepSeek-R1:最新の大規模言語モデル
stoneweb
February 02, 2025
Tweet
Share
More Decks by stoneweb
See All by stoneweb
ChatGPTのプロンプトの基本的な書き方
stoneweb
1
120
ChatGPTを業務に活用する具体例
stoneweb
0
88
ChatGPTのAIエージェント「Operator」について
stoneweb
0
51
Perplexityのスペースを使って簡単にAIクローンを作る方法
stoneweb
0
88
ChatGPTで作成した記事をPerplexity・Felo・Grokでファクトチェックする方法
stoneweb
0
270
ChatGPTとは
stoneweb
0
94
Other Decks in Technology
See All in Technology
TanStack Start 技術選定の裏側 / Findy-Lunch-LT-TanStack-Start
iktakahiro
1
120
Асинхронная коммуникация в Go: от понятного к душному. Дима Некрасов, Otello, 2ГИС
lamodatech
0
2.1k
MCPを理解する
yudai00
14
10k
Part1 GitHubってなんだろう?その1
tomokusaba
3
770
Global Azure2025(GitHub Copilot ハンズオン)
tomokusaba
2
760
AWSを利用する上で知っておきたい名前解決の話
nagisa53
6
800
本当に必要なのは「QAという技術」だった!試行錯誤から生まれた、品質とデリバリーの両取りアプローチ / Turns Out, "QA as a Discipline" Was the Key!
ar_tama
9
4.4k
LINE 購物幕後推手
line_developers_tw
PRO
0
450
LLMの開発と社会実装の今と未来 / AI Builders' Community (ABC) vol.2
pfn
PRO
1
140
2025年8月から始まるAWS Lambda INITフェーズ課金/AWS Lambda INIT phase billing changes
quiver
1
1k
kernelvm-brain-net
raspython3
0
560
Cursorをチョッパヤインタビューライターにチューニングする方法 / how to tuning cursor for interview write
shuzon
2
210
Featured
See All Featured
GitHub's CSS Performance
jonrohan
1031
460k
The Pragmatic Product Professional
lauravandoore
33
6.6k
Reflections from 52 weeks, 52 projects
jeffersonlam
349
20k
Site-Speed That Sticks
csswizardry
6
540
How to train your dragon (web standard)
notwaldorf
91
6k
Making Projects Easy
brettharned
116
6.2k
Building Adaptive Systems
keathley
41
2.5k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.6k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
47
2.7k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.7k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.3k
Agile that works and the tools we love
rasmusluckow
329
21k
Transcript
DeepSeek-R1: 最新の⼤規模 ⾔語ムヅラ DeepSeek-R1は、中国のAI企業DeepSeekによって開発された最新の⼤規模 ⾔語ムヅラ(LLM)で、2025年1⽉20⽇にエヺフヱセヺシとして公開されま した。このムヅラは、特に推論能⼒に特化しており、OpenAIのo1ムヅラと 同等、またはそれ以上の性能を持つとされています。DeepSeek-R1は、商 業利⽤を含む⾃由な利⽤が可能なMITョアスヱシのもとで提供されていま す。
主な特徴 エヺフヱセヺシ MITョアスヱシにより、開発者はムヅラを⾃由にォシソボ アジし、商業利⽤も可能です。 ⾼い推論能⼒ 数学的問題解決やフルギョポヱギ⽀援など、論理的思考を 要するソシキにおいて⾼精度な結果を⽰します。具体的に は、数学プヱタボヺキ「MATH-500」で97.3%の正解率を 記録し、フルギョポヱギ競技コアテ「Codeforces」では 96.3ハヺスヱソアラを達成しています。
強化学習の活⽤ DeepSeek-R1は、強化学習を⽤いた⾃律的な学習を⾏ い、さらに⾼品質なヅヺソを⽤いたビゟアヱタャヺドヱギ も⾏っています。この゠フルヺタにより、ムヅラは複雑な 問題解決能⼒を獲得し、特に数学やフルギョポヱギの分野 で優れた性能を発揮します。 ⼤規模ケヱツカシテ対応 最⼤128Kテヺキヱの⼊⼒を処理できるため、⻑⽂のデカ ャミヱテや⻑時間の会話においても⼀貫性のある応答を⽣ 成できます。
性能とベンチマーク 数学的推論 AIME 2024で79.8%のスコアを達成 し、MATH-500では97.3%の正解率 を記録しています。 プログラミング能⼒ Codeforcesで2029という⾼レーテ ィングを獲得し、プログラミング関 連のタスクに最適です。
総合的な知識理解⼒ MMLUテストで90.8%のスコアを達 成し、さまざまな知識を問うタスク においても⾼い性能を⽰していま す。
ケシテと利⽤⽅法 ⼊⼒テヺキヱ カメチサャバチテ時は$0.14/百万テヺキヱ、カメチサャポ シ時は$0.55/百万テヺキヱ。 出⼒テヺキヱ $2.19/百万テヺキヱ。 このように、DeepSeek-R1は⾼性能でありながら、ケシテハビェヺボヱシにも優れたムヅラです。
注意点 ヅヺソ保護に関する懸念 中国企業が開発したムヅラであるため、⼀部の利⽤者はヅヺソ 保護に関する懸念を抱いています。API経由で⼊⼒したヅヺソ が学習ヅヺソとして使⽤される可能性があるため、機密情報を 扱う際には注意が必要です。 特定の制約 台湾や中国政府に関連する質問では特定の制約が確認されてい ます。
まとめ DeepSeek-R1は、エヺフヱセヺシでありながら⾼い推論能⼒を持つ⼤規模 ⾔語ムヅラで、特に数学やフルギョポヱギの分野での応⽤が期待されていま す。強化学習を活⽤した⾃律的な学習フルスシにより、従枈のムヅラに⽐べ て優れた性能を発揮しています。商業利⽤が可能で、ケシテ効率も⾼いた め、研究機関や企業にとっても魅⼒的な選択肢となるでしょう。
STONEWEB 合同会社ストーンウェブ 経営者の「困った」にワンストップで応える!幅広い実務経験と経営視点をあわせ持つパートナーとして、WebサイトやSNS運⽤ はもちろん、採⽤やブランディングなど複数の課題を⼀括サポート。 余計なやり取りやコストを抑えながら、経営者の意思決定と 戦略⽴案に集中できる環境を整えます。 ご相談はこちら