Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
o1 pro mode の調査レポート
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
smorce
January 04, 2025
Research
250
0
Share
o1 pro mode の調査レポート
すべてAIで生成したスライドです。レイアウトはまだ調整中です。
smorce
January 04, 2025
More Decks by smorce
See All by smorce
2025/5/14(水) 私の大阪・関西万博 体験レポート
smorce
0
120
SHAPやLIMEなどの説明AI(XAI)のご紹介 / SHAP LIME PDP Grad-CAM
smorce
6
6.3k
Other Decks in Research
See All in Research
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
490
衛星×エッジAI勉強会 衛星上におけるAI処理制約とそ取組について
satai
4
470
ペットのかわいい瞬間を撮影する オートシャッターAIアプリへの スマートラベリングの適用
mssmkmr
0
480
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
220
IEEE AIxVR 2026 Keynote Talk: "Beyond Visibility: Understanding Scenes and Humans under Challenging Conditions with Diverse Sensing"
miso2024
0
180
NII S. Koyama's Lab Research Overview AY2026
skoyamalab
0
190
競合や要望に流されない─B2B SaaSでミニマム要件を決めるリアルな取り組み / Don't be swayed by competitors or requests - A real effort to determine minimum requirements for B2B SaaS
kaminashi
0
1.5k
Data Visualization Tools in the Age of AI
flekschas
0
140
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
220
製造業主導型経済からサービス経済化における中間層形成メカニズムのパラダイムシフト
yamotty
0
570
An Open and Reproducible Deep Research Agent for Long-Form Question Answering
ikuyamada
0
430
「AIとWhyを深堀る」をAIと深堀る
iflection
0
350
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
210
[SF Ruby Conf 2025] Rails X
palkan
2
1k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
430
The Curious Case for Waylosing
cassininazir
0
340
The Pragmatic Product Professional
lauravandoore
37
7.3k
Marketing to machines
jonoalderson
1
5.2k
Building the Perfect Custom Keyboard
takai
2
750
Typedesign – Prime Four
hannesfritz
42
3k
Accessibility Awareness
sabderemane
1
110
Raft: Consensus for Rubyists
vanstee
141
7.4k
Skip the Path - Find Your Career Trail
mkilby
1
110
Transcript
目次(1/6) • 1. 概要 – 1.1. o1 pro modeの基本情報 –
1.2. 料金と利用条件 – 1.3. 開発背景と目的
目次(2/6) • 2. o1 pro modeの主要機能と特徴 – 2.1. 高度な推論能力 –
2.2. マルチモーダル対応 – 2.3. 高速・正確な応答システム – 2.4. 思考時間の最適化機能
目次(3/6) • 3. o1 pro modeの性能評価 – 3.1. 数学分野での性能 –
3.2. プログラミング分野での性能 – 3.3. 科学的問題解決能力 – 3.4. 信頼性と一貫性の分析
目次(4/6) • 4. o1 pro modeの利用対象者と活用分野 – 4.1. 研究者・エンジニア向け機能 –
4.2. プログラマー向け機能 – 4.3. データサイエンティスト向け機能
目次(5/6) • 5. o1 pro modeの従来モデルとの比較 – 5.1. o1との性能差 –
5.2. GPT-4oとの違い – 5.3. 処理速度と精度の比較
目次(6/6) • 6. o1 pro modeの今後の展望 – 6.1. APIの可能性 –
6.2. 将来の開発方向性 – 6.3. 産業への影響
1. 概要
2. o1 pro modeの主要機能と特徴
3. o1 pro modeの性能評価
4. o1 pro modeの利用対象者と活用分野
5. o1 pro modeの従来モデルとの比較
6. o1 pro modeの今後の展望
1. 概要 • o1 pro modeの基本情報 – OpenAI開発の最新の推論モデル – 複雑な数学、科学、プログラミング問題に強い
– マルチモーダル対応(テキストと画像の同時解析) – 深い思考と高精度な回答を実現 – 従来モデルより高速化、誤答率削減 • 料金と利用条件 – ChatGPT Proプラン加入が必要(月額200ドル/約3 万円) – 通常のo1モデルはChatGPT Plus(月額30ドル)で利 用可能 • 開発背景と目的 – 複雑な問題に対する深い分析と正確な解答を目指 30 200 0 50 100 150 200 250 ChatGPT Plus ChatGPT Pro ChatGPT プランと料金比較 ChatGPT Plus ChatGPT Pro
2. o1 pro modeの主要機能と特徴 • 高度な推論能力 – 複雑な問題への深い思考と信頼性の高い回答生成 能力 –
データサイエンス、プログラミング、法律分野で GPT-4oを上回る正確性と包括性を外部評価で実 証済 – 数学では最適な解法を選択、科学では最新知見に 基づく回答生成、プログラミングでは効率的なア ルゴリズムとバグのないコード生成が可能 • 高速・正確な応答システム – 質問の難易度に応じた思考時間調整で、GPT-4o より速度と精度のバランスを最適化 – o1-previewより高速な回答生成 – 高度なアルゴリズムによる効率的な思考時間調整 credit by Unsplash
3. o1 pro modeの性能評価 • 数学分野での性能 – o1 pro modeはAIME
2024で86%の正答率、o1は 78% – 精度はo1 pro modeが85.8%、o1が78.3% – 4回連続正解率はo1 pro modeが80%、o1が66.7% • プログラミング分野での性能 – o1 pro modeはCodeforcesで90パーセンタイル、 o1は89パーセンタイル – 信頼性パーセンタイルはo1 pro modeが74.9%、 o1が64.2% • 科学的問題解決能力 – o1 pro modeはGPQA Diamondで79%の正答率、 o1は76% 78 78.3 67 89 64.2 64 76 75.6 67 86 85.8 80 90 74.9 75 79 79.3 74 0 20 40 60 80 100 o1とo1 pro modeの性能比較 o1 o1 pro mode
4. o1 pro modeの利用対象者と活用分野 • 研究者・エンジニア向け機能 – 高度な推論能力による複雑な課題解決 – 大阪大学入試レベルの数学問題への対応
– 安定的なコード生成とバグ削減 – 大規模データセットや複雑なシミュレーションの 高速処理 – 高度なアルゴリズム設計とエラー修正 • プログラマー向け機能 – リアルタイムコード生成とエラー修正サポート – プロトタイプ開発の高速化 – 高度なアルゴリズム設計と並列処理プログラム作 成 – 安定したコード生成と高い信頼性 – 競技プログラミングでの高正解率 credit by Unsplash
5. o1 pro modeの従来モデルとの比較 • o1との性能差 – o1 pro modeは、より多くの計算リソースを活用
し、深い思考と高精度な回答を実現する。 – AIME 2024で86%、Codeforcesで90%の正解率を 記録し、o1を上回る。 – 数学、プログラミングなど様々な分野でo1を上回 る性能 • GPT-4oとの違い – 処理速度と精度のバランスが異なる。o1 pro modeは複雑な問題に強く、GPT-4oは処理速度が 速い。 – 研究論文分析や高度な計算にはo1 pro mode、日 常的なタスクにはGPT-4oが適している。 – o1はGPT-4oより思考連鎖の深さと精度で優れ、 命令階層により制御性と安全性が向上している。 86 90 78 89 70 75 80 85 90 95 AIME 2024 Codeforces o1 pro modeとo1の正解率比較 o1 pro mode o1
6. o1 pro modeの今後の展望 • APIの可能性 – o1 Pro ModeのAPI提供により、スタートアップ企
業はProレベルのAI機能を自社製品に組み込める 。 – 高品質なデータ解析やインテリジェントな提案が 可能になり、カスタマーサービスロボットの構築 も効率化される。 – ECプラットフォームは、自動生成されたコンテン ツで運用効率とコンバージョン率を向上できる。 – OpenAIは構造化出力、関数呼び出し、画像理解 APIなどの新機能を追加する計画。 – 中国の起業家は、新しいSaaSツールや海外市場向 けサービス構築に活用できる。 • 将来の開発方向性 – OpenAIはo1モデルとChatGPT Proの機能改善を 継続。ChatGPT Proはより長い時間、多くの処理 credit by Unsplash