Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
OpenAI o1-preview
Search
MARGO
September 21, 2024
Business
0
28
OpenAI o1-preview
MARGO
September 21, 2024
Tweet
Share
More Decks by MARGO
See All by MARGO
Shopifyピッチデッキ(和訳)
margoslide
0
11
Features of MARGO
margoslide
0
110
自民党総裁選2024
margoslide
0
28
MrBeast HOW TO SUCCEED IN MRBEAST PRODUCTION
margoslide
0
940
エヌビディア2024年第2クォーター決算
margoslide
0
21
Dodgers Roster
margoslide
0
12
Other Decks in Business
See All in Business
グラハム株式会社_採用ピッチ_20241225__1__compressed.pdf
shu30
0
300
20250613_CMC_2025_A3
hideki_ojima
0
480
20250701_UPDATER_companysummary
updater_pr
0
80k
私が変えてきたこと、変えなかったこと
akatsuki174
2
280
大AI時代を長く活躍するための 「コンフォート・ゾーン」の新解釈
mkitahara01985
0
750
ソーシング・ブラザーズ株式会社|会社説明資料
sbro
0
530
Leading Mark新卒採用資料
unno
0
2.3k
AIUX is Agentic UX
kan
0
280
tokyo_dbt_meetup_#14_意志ある羅針盤たれ<データサイド>
t_yamaguchi
3
530
メドピアグループ紹介資料
medpeer_recruit
10
130k
株式会社D2C ID 会社案内 / recruit
d2cid
2
4.3k
ベタートラップと夏
mosa_siru
8
3k
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
82
9.1k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Speed Design
sergeychernyshev
32
1k
Balancing Empowerment & Direction
lara
1
380
Building an army of robots
kneath
306
45k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.3k
Java REST API Framework Comparison - PWX 2021
mraible
31
8.7k
Building Flexible Design Systems
yeseniaperezcruz
328
39k
Why Our Code Smells
bkeepers
PRO
337
57k
Why You Should Never Use an ORM
jnunemaker
PRO
58
9.4k
Designing for Performance
lara
609
69k
Building Applications with DynamoDB
mza
95
6.5k
Transcript
OpenAI o1 プレビュー September 12, 2024
次世代AIの幕開け OpenAIはAI技術の新たな進化を象徴する「o1-preview」 を発表しました。このモデルは、より深く考え、より困難 な問題を解決できる能力を備えています。 人間の思考プロセスを模倣し、科学やコーディング、数学 の分野で際立った性能を発揮します。
o1-previewの特徴 問題解決の新しいアプローチ これまでのAIは、迅速な応答が求められましたが、o1はそ れとは異なり、問題解決に時間をかけて慎重に取り組みま す。モデルは、タスクに直面したときに複数の戦略を試 し、最適な解決策を見つける能力を持ちます。 私たちのテストでは、物理学、化学、生物学の困難な問題 において、博士課程の学生に匹敵する結果を達成しまし た。
数学とコーディングでの躍進 特に注目すべきは、数学とコーディング分野での大幅な性 能向上です。国際数学オリンピック(IMO)の予選試験に おいて、従来のモデルが13%しか解けなかった問題を、 o1-previewは83%の正答率で解決しました。 また、Codeforcesのプログラミングコンテストでは、89 パーセンタイルの成績を達成しました。
科学の進展を支える力 o1-previewは科学者にとっても大きな力を提供します。特 に複雑な物理学の問題や、生命科学における細胞シーケン シングのデータ注釈など、通常なら数時間かかる作業を短 時間で行うことが可能です。 このモデルは、問題の解決に向けて柔軟にアプローチを変 え、最も効果的な解決策を導き出します。
o1-mini: 開発者に最適なモデル 開発者に向けた「o1-mini」も同時に発表されました。こ れは、o1-previewの小型版であり、より高速かつ安価に複 雑なコーディングタスクを実行できます。 80%安価なコスト 高度なデバッグ能力 高速な推論速度 これにより、開発者は多くのシナリオで効率的なソリュー ションを得ることができます。
安全性の確保: 次世代AIの責任 o1-previewは、単なる問題解決能力だけではなく、安全性 にも大きな進歩を遂げています。私たちは、このモデルが セーフティルールを遵守する能力を大幅に強化しました。 テストの結果、最も難しい安全性テストでGPT-4が22点だ ったのに対し、o1-previewは84点を獲得しました。
安全性とガバナンスの強化 AIの進展に伴い、安全性と倫理がこれまで以上に重要な課 題となっています。OpenAIは米国および英国のAI安全性 研究所と協力し、モデルの評価およびテストを強化してい ます。これにより、将来的なAIのリリース前後における安 全性を確保します。 私たちは、内部ガバナンスやレッドチームテストを通じ て、AIの安全性向上を目指しています。
AIの未来を切り開く o1-previewは、私たちが抱える最も困難な問題に取り組む 能力を持つ新たなAI技術のスタートに過ぎません。将来的 には、ウェブの情報を取得したり、ファイルや画像をアッ プロードする機能などが追加される予定です。 この進化により、AIがどのように私たちの生活を改善し、 問題解決に役立つかが大きく変わるでしょう。
o1-previewの利用方法 現在、ChatGPT PlusとTeamのユーザーは、このo1シリー ズをモデルピッカーから手動で選択できます。また、 ChatGPT EnterpriseとEduユーザーも、来週からこのモデ ルを利用できるようになります。
o1-previewの特 徴 API経由でのプロトタイプ開発 も可能 1週間あたりのリクエスト回数 制限は30件 o1-miniは50件まで利用可能
今後の展望 OpenAIは、今後もo1シリーズをさらに発展させ、新しい 機能やモデルを追加していく予定です。この新しい推論モ デルは、AIの可能性を拡大し、多くの分野で応用されるこ とが期待されています。 次のアップデートでは、ファイルや画像のアップロード機 能など、より幅広いタスクに対応できるように進化する予 定です。