Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
OpenAI o1-preview
Search
MARGO
September 21, 2024
Business
0
19
OpenAI o1-preview
MARGO
September 21, 2024
Tweet
Share
More Decks by MARGO
See All by MARGO
Shopifyピッチデッキ(和訳)
margoslide
0
4
Features of MARGO
margoslide
0
81
自民党総裁選2024
margoslide
0
17
MrBeast HOW TO SUCCEED IN MRBEAST PRODUCTION
margoslide
0
800
エヌビディア2024年第2クォーター決算
margoslide
0
11
Dodgers Roster
margoslide
0
7
Other Decks in Business
See All in Business
Sales Marker Culture Book(English)
salesmarker
PRO
1
3k
Japan Open Chain ホワイトペーパー
gugroup
0
230
なぜ施策優先度を意思決定しなければならないのか? 経験から得た要因と対策
mkitahara01985
2
200
株式会社ワンコイングリッシュ 会社説明資料
oce_recruit
1
7.2k
いま、データに必要な解像度
hik0107
33
12k
株式会社miibo|採用デック
natsumidnx
0
140
ドローンを活用した汚泥焼却炉内点検のDX
tokyo_metropolitan_gov_digital_hr
0
320
UIL広島駅前 利用検討者への事業所紹介
ymtyhka7o4o8
0
220
スーパーマーケットのこれまでとこれから
10xinc
3
1.9k
Mercari-Fact-book_jp
mercari_inc
3
150k
AWS の生成 AI 最前線 : 顧客起点のイノベーション
icoxfog417
PRO
0
870
仮説のマップ・ループ・リープ
tumada
PRO
11
3.8k
Featured
See All Featured
A better future with KSS
kneath
238
17k
How GitHub (no longer) Works
holman
311
140k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.2k
Raft: Consensus for Rubyists
vanstee
137
6.7k
The Language of Interfaces
destraynor
154
24k
jQuery: Nuts, Bolts and Bling
dougneiner
61
7.5k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
29
2k
Designing for humans not robots
tammielis
250
25k
Git: the NoSQL Database
bkeepers
PRO
427
64k
How To Stay Up To Date on Web Technology
chriscoyier
789
250k
Fashionably flexible responsive web design (full day workshop)
malarkey
405
65k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
0
94
Transcript
OpenAI o1 プレビュー September 12, 2024
次世代AIの幕開け OpenAIはAI技術の新たな進化を象徴する「o1-preview」 を発表しました。このモデルは、より深く考え、より困難 な問題を解決できる能力を備えています。 人間の思考プロセスを模倣し、科学やコーディング、数学 の分野で際立った性能を発揮します。
o1-previewの特徴 問題解決の新しいアプローチ これまでのAIは、迅速な応答が求められましたが、o1はそ れとは異なり、問題解決に時間をかけて慎重に取り組みま す。モデルは、タスクに直面したときに複数の戦略を試 し、最適な解決策を見つける能力を持ちます。 私たちのテストでは、物理学、化学、生物学の困難な問題 において、博士課程の学生に匹敵する結果を達成しまし た。
数学とコーディングでの躍進 特に注目すべきは、数学とコーディング分野での大幅な性 能向上です。国際数学オリンピック(IMO)の予選試験に おいて、従来のモデルが13%しか解けなかった問題を、 o1-previewは83%の正答率で解決しました。 また、Codeforcesのプログラミングコンテストでは、89 パーセンタイルの成績を達成しました。
科学の進展を支える力 o1-previewは科学者にとっても大きな力を提供します。特 に複雑な物理学の問題や、生命科学における細胞シーケン シングのデータ注釈など、通常なら数時間かかる作業を短 時間で行うことが可能です。 このモデルは、問題の解決に向けて柔軟にアプローチを変 え、最も効果的な解決策を導き出します。
o1-mini: 開発者に最適なモデル 開発者に向けた「o1-mini」も同時に発表されました。こ れは、o1-previewの小型版であり、より高速かつ安価に複 雑なコーディングタスクを実行できます。 80%安価なコスト 高度なデバッグ能力 高速な推論速度 これにより、開発者は多くのシナリオで効率的なソリュー ションを得ることができます。
安全性の確保: 次世代AIの責任 o1-previewは、単なる問題解決能力だけではなく、安全性 にも大きな進歩を遂げています。私たちは、このモデルが セーフティルールを遵守する能力を大幅に強化しました。 テストの結果、最も難しい安全性テストでGPT-4が22点だ ったのに対し、o1-previewは84点を獲得しました。
安全性とガバナンスの強化 AIの進展に伴い、安全性と倫理がこれまで以上に重要な課 題となっています。OpenAIは米国および英国のAI安全性 研究所と協力し、モデルの評価およびテストを強化してい ます。これにより、将来的なAIのリリース前後における安 全性を確保します。 私たちは、内部ガバナンスやレッドチームテストを通じ て、AIの安全性向上を目指しています。
AIの未来を切り開く o1-previewは、私たちが抱える最も困難な問題に取り組む 能力を持つ新たなAI技術のスタートに過ぎません。将来的 には、ウェブの情報を取得したり、ファイルや画像をアッ プロードする機能などが追加される予定です。 この進化により、AIがどのように私たちの生活を改善し、 問題解決に役立つかが大きく変わるでしょう。
o1-previewの利用方法 現在、ChatGPT PlusとTeamのユーザーは、このo1シリー ズをモデルピッカーから手動で選択できます。また、 ChatGPT EnterpriseとEduユーザーも、来週からこのモデ ルを利用できるようになります。
o1-previewの特 徴 API経由でのプロトタイプ開発 も可能 1週間あたりのリクエスト回数 制限は30件 o1-miniは50件まで利用可能
今後の展望 OpenAIは、今後もo1シリーズをさらに発展させ、新しい 機能やモデルを追加していく予定です。この新しい推論モ デルは、AIの可能性を拡大し、多くの分野で応用されるこ とが期待されています。 次のアップデートでは、ファイルや画像のアップロード機 能など、より幅広いタスクに対応できるように進化する予 定です。