Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
OpenAI o1-preview
Search
MARGO
September 21, 2024
Business
0
20
OpenAI o1-preview
MARGO
September 21, 2024
Tweet
Share
More Decks by MARGO
See All by MARGO
Shopifyピッチデッキ(和訳)
margoslide
0
4
Features of MARGO
margoslide
0
94
自民党総裁選2024
margoslide
0
22
MrBeast HOW TO SUCCEED IN MRBEAST PRODUCTION
margoslide
0
850
エヌビディア2024年第2クォーター決算
margoslide
0
13
Dodgers Roster
margoslide
0
8
Other Decks in Business
See All in Business
技術は十分条件、信頼は必要条件
natty_natty254
1
220
Sales Marker Culture book
salesmarker
PRO
12
30k
エピックベース株式会社 会社説明資料
ekubokotani
0
590
新たなプロダクトで成果を掴む!PMのサバイブ術 🥷
tochiba
5
6.3k
アラフォーよわよわエンジニアの生存戦略
prsnic
0
180
株式会社トリビュー|会社説明資料 / Company Deck
tribeau
2
8.1k
Srush Company Deck
tomomifuruya
0
3.7k
国立大学法人等職員仕事ガイド(北海道地区)
univstaffhokkaido
0
170
フレームワークを生み出すメタフレームワークという考え方 -適応型から生成型へ- #RSGT2025 / From adaptive to generative
kyonmm
PRO
2
2.8k
株式会社PoliPoli Recruit Deck (採用候補者向け)/Recruit Deck
polipoli
0
550
2024年5月採用広報資料.pdf
gw_recruit
0
2.3k
Jibungotoを最大限発揮させて育成コストをかけすぎないオンボーディング
nogahighland
1
720
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
132
33k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
27
1.9k
Being A Developer After 40
akosma
89
590k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Large-scale JavaScript Application Architecture
addyosmani
510
110k
Become a Pro
speakerdeck
PRO
26
5.1k
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
The Pragmatic Product Professional
lauravandoore
32
6.4k
Making the Leap to Tech Lead
cromwellryan
133
9.1k
Transcript
OpenAI o1 プレビュー September 12, 2024
次世代AIの幕開け OpenAIはAI技術の新たな進化を象徴する「o1-preview」 を発表しました。このモデルは、より深く考え、より困難 な問題を解決できる能力を備えています。 人間の思考プロセスを模倣し、科学やコーディング、数学 の分野で際立った性能を発揮します。
o1-previewの特徴 問題解決の新しいアプローチ これまでのAIは、迅速な応答が求められましたが、o1はそ れとは異なり、問題解決に時間をかけて慎重に取り組みま す。モデルは、タスクに直面したときに複数の戦略を試 し、最適な解決策を見つける能力を持ちます。 私たちのテストでは、物理学、化学、生物学の困難な問題 において、博士課程の学生に匹敵する結果を達成しまし た。
数学とコーディングでの躍進 特に注目すべきは、数学とコーディング分野での大幅な性 能向上です。国際数学オリンピック(IMO)の予選試験に おいて、従来のモデルが13%しか解けなかった問題を、 o1-previewは83%の正答率で解決しました。 また、Codeforcesのプログラミングコンテストでは、89 パーセンタイルの成績を達成しました。
科学の進展を支える力 o1-previewは科学者にとっても大きな力を提供します。特 に複雑な物理学の問題や、生命科学における細胞シーケン シングのデータ注釈など、通常なら数時間かかる作業を短 時間で行うことが可能です。 このモデルは、問題の解決に向けて柔軟にアプローチを変 え、最も効果的な解決策を導き出します。
o1-mini: 開発者に最適なモデル 開発者に向けた「o1-mini」も同時に発表されました。こ れは、o1-previewの小型版であり、より高速かつ安価に複 雑なコーディングタスクを実行できます。 80%安価なコスト 高度なデバッグ能力 高速な推論速度 これにより、開発者は多くのシナリオで効率的なソリュー ションを得ることができます。
安全性の確保: 次世代AIの責任 o1-previewは、単なる問題解決能力だけではなく、安全性 にも大きな進歩を遂げています。私たちは、このモデルが セーフティルールを遵守する能力を大幅に強化しました。 テストの結果、最も難しい安全性テストでGPT-4が22点だ ったのに対し、o1-previewは84点を獲得しました。
安全性とガバナンスの強化 AIの進展に伴い、安全性と倫理がこれまで以上に重要な課 題となっています。OpenAIは米国および英国のAI安全性 研究所と協力し、モデルの評価およびテストを強化してい ます。これにより、将来的なAIのリリース前後における安 全性を確保します。 私たちは、内部ガバナンスやレッドチームテストを通じ て、AIの安全性向上を目指しています。
AIの未来を切り開く o1-previewは、私たちが抱える最も困難な問題に取り組む 能力を持つ新たなAI技術のスタートに過ぎません。将来的 には、ウェブの情報を取得したり、ファイルや画像をアッ プロードする機能などが追加される予定です。 この進化により、AIがどのように私たちの生活を改善し、 問題解決に役立つかが大きく変わるでしょう。
o1-previewの利用方法 現在、ChatGPT PlusとTeamのユーザーは、このo1シリー ズをモデルピッカーから手動で選択できます。また、 ChatGPT EnterpriseとEduユーザーも、来週からこのモデ ルを利用できるようになります。
o1-previewの特 徴 API経由でのプロトタイプ開発 も可能 1週間あたりのリクエスト回数 制限は30件 o1-miniは50件まで利用可能
今後の展望 OpenAIは、今後もo1シリーズをさらに発展させ、新しい 機能やモデルを追加していく予定です。この新しい推論モ デルは、AIの可能性を拡大し、多くの分野で応用されるこ とが期待されています。 次のアップデートでは、ファイルや画像のアップロード機 能など、より幅広いタスクに対応できるように進化する予 定です。