Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
OpenAI o1-preview
Search
MARGO
September 21, 2024
Business
0
9
OpenAI o1-preview
MARGO
September 21, 2024
Tweet
Share
More Decks by MARGO
See All by MARGO
Features of MARGO
margoslide
0
11
自民党総裁選2024
margoslide
0
10
MrBeast HOW TO SUCCEED IN MRBEAST PRODUCTION
margoslide
0
660
エヌビディア2024年第2クォーター決算
margoslide
0
7
Dodgers Roster
margoslide
0
5
Other Decks in Business
See All in Business
Amazon Chime SDK と Vonage Video API の徹底比較
mobilebiz
0
260
ヒューマンエラーの本を読んだ ~報告会~
o0h
PRO
2
170
Untangling software delivery with Team Topologies, flow metrics, careful decoupling, and Adapt Together™️
matthewskelton
PRO
3
380
遠くへ行きたければ、チームで行け!アジャイルとスクラムに学ぶチームの成長のためのエッセンス
curanosuke
0
140
横浜新都市脳神経外科病院 リハビリテーション科 職員寮案内
yokohamashintoshihp
0
180
株式会社EventHub 会社紹介資料
eventhub
0
26k
フィードバックされやすい人になろう
nrryuya
21
14k
Continuous Stewardship - effective, humane services enriched by software - Fast Flow Conf 2024 - London - Matthew Skelton
matthewskelton
PRO
5
440
ワンメディア株式会社 会社紹介資料
sakiyogoro
0
2k
malna-recruiting-pitch
malna
0
310
横浜新都市脳神経外科病院 リハビリテーション科採用ピッチ
yokohamashintoshihp
0
260
NOT A HOTEL SOFTWARE DECK
notahotel
6
62k
Featured
See All Featured
Teambox: Starting and Learning
jrom
131
8.7k
Being A Developer After 40
akosma
84
590k
Thoughts on Productivity
jonyablonski
67
4.2k
How GitHub (no longer) Works
holman
310
140k
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
What’s in a name? Adding method to the madness
productmarketing
PRO
21
3k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
23
1.7k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
166
48k
The Mythical Team-Month
searls
218
43k
Raft: Consensus for Rubyists
vanstee
136
6.6k
Automating Front-end Workflow
addyosmani
1365
200k
Designing Experiences People Love
moore
138
23k
Transcript
OpenAI o1 プレビュー September 12, 2024
次世代AIの幕開け OpenAIはAI技術の新たな進化を象徴する「o1-preview」 を発表しました。このモデルは、より深く考え、より困難 な問題を解決できる能力を備えています。 人間の思考プロセスを模倣し、科学やコーディング、数学 の分野で際立った性能を発揮します。
o1-previewの特徴 問題解決の新しいアプローチ これまでのAIは、迅速な応答が求められましたが、o1はそ れとは異なり、問題解決に時間をかけて慎重に取り組みま す。モデルは、タスクに直面したときに複数の戦略を試 し、最適な解決策を見つける能力を持ちます。 私たちのテストでは、物理学、化学、生物学の困難な問題 において、博士課程の学生に匹敵する結果を達成しまし た。
数学とコーディングでの躍進 特に注目すべきは、数学とコーディング分野での大幅な性 能向上です。国際数学オリンピック(IMO)の予選試験に おいて、従来のモデルが13%しか解けなかった問題を、 o1-previewは83%の正答率で解決しました。 また、Codeforcesのプログラミングコンテストでは、89 パーセンタイルの成績を達成しました。
科学の進展を支える力 o1-previewは科学者にとっても大きな力を提供します。特 に複雑な物理学の問題や、生命科学における細胞シーケン シングのデータ注釈など、通常なら数時間かかる作業を短 時間で行うことが可能です。 このモデルは、問題の解決に向けて柔軟にアプローチを変 え、最も効果的な解決策を導き出します。
o1-mini: 開発者に最適なモデル 開発者に向けた「o1-mini」も同時に発表されました。こ れは、o1-previewの小型版であり、より高速かつ安価に複 雑なコーディングタスクを実行できます。 80%安価なコスト 高度なデバッグ能力 高速な推論速度 これにより、開発者は多くのシナリオで効率的なソリュー ションを得ることができます。
安全性の確保: 次世代AIの責任 o1-previewは、単なる問題解決能力だけではなく、安全性 にも大きな進歩を遂げています。私たちは、このモデルが セーフティルールを遵守する能力を大幅に強化しました。 テストの結果、最も難しい安全性テストでGPT-4が22点だ ったのに対し、o1-previewは84点を獲得しました。
安全性とガバナンスの強化 AIの進展に伴い、安全性と倫理がこれまで以上に重要な課 題となっています。OpenAIは米国および英国のAI安全性 研究所と協力し、モデルの評価およびテストを強化してい ます。これにより、将来的なAIのリリース前後における安 全性を確保します。 私たちは、内部ガバナンスやレッドチームテストを通じ て、AIの安全性向上を目指しています。
AIの未来を切り開く o1-previewは、私たちが抱える最も困難な問題に取り組む 能力を持つ新たなAI技術のスタートに過ぎません。将来的 には、ウェブの情報を取得したり、ファイルや画像をアッ プロードする機能などが追加される予定です。 この進化により、AIがどのように私たちの生活を改善し、 問題解決に役立つかが大きく変わるでしょう。
o1-previewの利用方法 現在、ChatGPT PlusとTeamのユーザーは、このo1シリー ズをモデルピッカーから手動で選択できます。また、 ChatGPT EnterpriseとEduユーザーも、来週からこのモデ ルを利用できるようになります。
o1-previewの特 徴 API経由でのプロトタイプ開発 も可能 1週間あたりのリクエスト回数 制限は30件 o1-miniは50件まで利用可能
今後の展望 OpenAIは、今後もo1シリーズをさらに発展させ、新しい 機能やモデルを追加していく予定です。この新しい推論モ デルは、AIの可能性を拡大し、多くの分野で応用されるこ とが期待されています。 次のアップデートでは、ファイルや画像のアップロード機 能など、より幅広いタスクに対応できるように進化する予 定です。