Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
新モデルOpenAI_o1_実際に試してみたらこうなった.pdf
Search
makishy
September 18, 2024
0
290
新モデルOpenAI_o1_実際に試してみたらこうなった.pdf
2024/09/18に登壇したLT資料です。
https://minorun365.connpass.com/event/331247/presentation/
makishy
September 18, 2024
Tweet
Share
More Decks by makishy
See All by makishy
AI駆動のサービスデザイン_ビジネスプランの新時代.pdf
makishy
1
55
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
510
110k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
6.9k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.3k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.7k
Designing for humans not robots
tammielis
250
25k
Imperfection Machines: The Place of Print at Facebook
scottboms
265
13k
Why Our Code Smells
bkeepers
PRO
334
57k
KATA
mclloyd
29
14k
It's Worth the Effort
3n
183
27k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
131
33k
The Language of Interfaces
destraynor
154
24k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
Transcript
新モデルOpenAI o1 実際に試してみたらこうなった 2024.09.18 KDDI アジャイル開発センター 岸田 正吉
2 KDDI Agile Development Center Corporation About Me 岸田 正吉
KDDIアジャイル開発センター(ソフトウェアエンジニアリード)兼 KDDI DIGITAL GATE (エンジニアリングマネージャー) OA機器メーカーのソフトウェアエンジニア経験を経て2018年にKDDIに入社。 KDDI DIGITAL GATEにて金融、小売、製造、建設など幅広い業界/業種のお 客さまのDX事業立ち上げやアジャイル内製開発チーム立ち上げに従事。 現在は、生成AIセミナーを通じた社内外への活用推進、企業への導入支援、 LLMを用いたプロダクト開発など生成AI普及のため精力的に活動中。
3 KDDI Agile Development Center Corporation About Me Gemini 1.5
Amazon Bedrock (Claude3) 新規事業企画アイデア創出 新規事業企画アイデア創出 +企画書作成 RAGを使った社内データ連携 Azure OpenAI Service (GPT-4) モデルの特性を活かしつつ、様々なLLMを使った社内外プロダクトを開発中
4 KDDI Agile Development Center Corporation はじめに 本日お話すること • OpenAI
o1とは(概要をさらっと) • 実際に試してみたことを共有 ◦ 問題解決型タスク ◦ プログラミング お話しないこと • 生成AI・LLMに関する技術要素 • 導入事例
5 KDDI Agile Development Center Corporation OpenAI o1とは OpenAI社が開発した最新のLLMモデル。(2024年9月12日に発表) ChatGPT
Plusとteamユーザーが12日から順次利用可能。無料のEnterpriseもしくはEduユーザーは今週から利用可能? 難しい問題を解決するための新しい推論モデルシリーズ • 物理、化学、生物の難しいタスクにおいて博士課程の学生と同等のパフォーマンスを発揮 • 数学やコーディング能力も優れている • Web閲覧、ファイル・画像入力による処理は未対応 • 複雑な推論タスクでの大きな進歩を示し、AIの新たなレベルを象徴
6 KDDI Agile Development Center Corporation OpenAI o1の制限 OpenAI o1-preview
では週に 30 件50件のメッセージ、OpenAI o1-mini では週 1日に 50 件のメッセージまで利用 可能 OpenAI o1-preview および o1-mini モデルでは、次の高度なツールや機能にアクセスできない。 • メモリ • カスタム指示 • データ分析 • ファイルのアップロード • ウェブ閲覧 • GPTの発見と使用 • ビジョン • 音声入力 上記ツールを利用するには、GPT-4o に切り替える必要あり
使ってみる
8 KDDI Agile Development Center Corporation 問題解決型タスク
9 KDDI Agile Development Center Corporation マンホール問題 深い推論が必要な問題を解いてみます。 「東京都内マンホールはいくつあるか?」 フェルミ推定の問題も非常にオーソドックスな例題の1つ
フェルミ推定とは、実際に調査することが難しい数量や規模を、最低限の知識と論理的思考力を使って短時間 で推定する手法。 一見予想がつかない数値を、国土面積や身近にあるもの数などから論理的に推定します。日 常生活からビジネスまで幅広い場面で応用される手法です。
10 KDDI Agile Development Center Corporation プロンプト 東京都内にマンホールがいくつあるか、フェルミ推定を行ってください
11 KDDI Agile Development Center Corporation GPT-4oの回答 道路の占める面積 ざっくり20% 推定結果
88,000個
12 KDDI Agile Development Center Corporation OpenAI o1-previewの回答 GPT4oに比べるとも う少し細かく推定
推定結果 40万個
13 KDDI Agile Development Center Corporation 正解は?
14 KDDI Agile Development Center Corporation o1思考の概要 o1ではどういった思考で結果 が得られたか、その概要を確 認することができる
15 KDDI Agile Development Center Corporation プログラミング
16 KDDI Agile Development Center Corporation neko-game 【ゲームの内容】 ゲームのキャラクターはネコ。 ネコは画面の左右に移動する。
上から魚が降ってくる。 魚をキャッチするとポイントが加算、たまに犬が降ってきて、犬に 接触するとポイントが減算される。 ポイントがマイナスになったらゲーム終了。 なぞゲーム...
17 KDDI Agile Development Center Corporation プロンプト react.jsを使ってスマホゲームを作成します。viteを使ってプロジェクトを作成します。 言語は TypeScriptを使います。
以下の内容に従ってゲームを作成してください。 ```ゲームの内容 ゲームのキャラクターはネコです。ネコは画面の左右に移動します。 上から魚が降ってきます。 魚をキャッチするとポイントが加算されます。たまに犬が降ってきて、犬に接触するとポイン トが減算されます。 ポイントがマイナスになったらゲーム終了です。
デモ
19 KDDI Agile Development Center Corporation OpenAI o1-previewの回答 ディレクトリ構成やコンポー ネント化まで考慮して生成し
てくれる
20 KDDI Agile Development Center Corporation できあがったゲーム 解説 • ネコの移動:
画面のドラッグ操作でネコが左右に移動します。@use- gesture/react を使用してドラッグイベントを処理しています。 • オブジェクトの生成: 一定間隔で魚または犬のオブジェクトがランダムな位置から 降ってきます。 • 衝突判定: ネコとオブジェクトの位置関係を計算し、接触した場合にスコアを加算 または減算します。 • ゲームオーバー: スコアがマイナスになるとゲームオーバーになり、再スタートボ タンが表示されます。 キャラクターは自作してます
21 KDDI Agile Development Center Corporation GPT-4oに代替可能? o1 モデルは推論において大きな進歩をもたらすが、すべてのユースケースで GPT-4o
を置き換えることを意図したも のではない。o1は利用可能な機能も限定的(高度なツールの利用不可) 画像入力、関数呼び出し、または一貫して高速な応答時間を必要とするアプリケーションの場合、GPT-4o および GPT-4o mini モデルは引き続き適切な選択です。ただし、深い推論を必要とし、より長い応答時間に対応できるアプリ ケーションの開発を目指している場合は、o1 モデルが最適な選択肢になる可能性があります。 【引用元】 https://platform.openai.com/docs/guides/reasoning/reasoning
22 KDDI Agile Development Center Corporation まとめ 2024年9月12日に新しいモデルOpenAI o1がリリース 難しい問題を解決するための新しい推論モデル
深い推論やプログラミングなどを得意とする 利用可能な機能は限定的で、現状は高度なツールや機能は利用できない 深い推論や複雑なプログラミングが必要なユースケースでは最適な選択肢となる(かもしれない)
Be a Change Leader. アジャイルに力を与え 共に成長し続ける社会を創る