DeepSeek-R1：最新の大規模言語モデル

DeepSeek-R1: 最新の⼤規模⾔語ムヅラ DeepSeek-R1は、中国のAI企業DeepSeekによって開発された最新の⼤規模⾔語ムヅラ（LLM）で、2025年1⽉20⽇にエヺフヱセヺシとして公開されました。このムヅラは、特に推論能⼒に特化しており、OpenAIのo1ムヅラと同等、またはそれ以上の性能を持つとされています。DeepSeek-R1は、商業利⽤を含む⾃由な利⽤が可能なMITョアスヱシのもとで提供されています。

主な特徴エヺフヱセヺシ MITョアスヱシにより、開発者はムヅラを⾃由にォシソボアジし、商業利⽤も可能です。⾼い推論能⼒数学的問題解決やフルギョポヱギ⽀援など、論理的思考を要するソシキにおいて⾼精度な結果を⽰します。具体的には、数学プヱタボヺキ「MATH-500」で97.3%の正解率を記録し、フルギョポヱギ競技コアテ「Codeforces」では 96.3ハヺスヱソアラを達成しています。
強化学習の活⽤ DeepSeek-R1は、強化学習を⽤いた⾃律的な学習を⾏い、さらに⾼品質なヅヺソを⽤いたビゟアヱタャヺドヱギも⾏っています。この゠フルヺタにより、ムヅラは複雑な問題解決能⼒を獲得し、特に数学やフルギョポヱギの分野で優れた性能を発揮します。⼤規模ケヱツカシテ対応最⼤128Kテヺキヱの⼊⼒を処理できるため、⻑⽂のデカャミヱテや⻑時間の会話においても⼀貫性のある応答を⽣成できます。

性能とベンチマーク数学的推論 AIME 2024で79.8%のスコアを達成し、MATH-500では97.3%の正解率を記録しています。プログラミング能⼒ Codeforcesで2029という⾼レーティングを獲得し、プログラミング関連のタスクに最適です。
総合的な知識理解⼒ MMLUテストで90.8%のスコアを達成し、さまざまな知識を問うタスクにおいても⾼い性能を⽰しています。

ケシテと利⽤⽅法⼊⼒テヺキヱカメチサャバチテ時は$0.14/百万テヺキヱ、カメチサャポシ時は$0.55/百万テヺキヱ。出⼒テヺキヱ $2.19/百万テヺキヱ。このように、DeepSeek-R1は⾼性能でありながら、ケシテハビェヺボヱシにも優れたムヅラです。

注意点ヅヺソ保護に関する懸念中国企業が開発したムヅラであるため、⼀部の利⽤者はヅヺソ保護に関する懸念を抱いています。API経由で⼊⼒したヅヺソが学習ヅヺソとして使⽤される可能性があるため、機密情報を扱う際には注意が必要です。特定の制約台湾や中国政府に関連する質問では特定の制約が確認されています。

まとめ DeepSeek-R1は、エヺフヱセヺシでありながら⾼い推論能⼒を持つ⼤規模⾔語ムヅラで、特に数学やフルギョポヱギの分野での応⽤が期待されています。強化学習を活⽤した⾃律的な学習フルスシにより、従枈のムヅラに⽐べて優れた性能を発揮しています。商業利⽤が可能で、ケシテ効率も⾼いため、研究機関や企業にとっても魅⼒的な選択肢となるでしょう。

STONEWEB 合同会社ストーンウェブ経営者の「困った」にワンストップで応える！幅広い実務経験と経営視点をあわせ持つパートナーとして、WebサイトやSNS運⽤はもちろん、採⽤やブランディングなど複数の課題を⼀括サポート。余計なやり取りやコストを抑えながら、経営者の意思決定と戦略⽴案に集中できる環境を整えます。ご相談はこちら

DeepSeek-R1：最新の大規模言語モデル

DeepSeek-R1：最新の大規模言語モデル

stoneweb

More Decks by stoneweb

Other Decks in Technology

Featured

Transcript

性能とベンチマーク数学的推論 AIME 2024で79.8%のスコアを達成し、MATH-500では97.3%の正解率を記録しています。プログラミング能⼒ Codeforcesで2029という⾼レーティングを獲得し、プログラミング関連のタスクに最適です。