Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20240624_ビジネスマンとして知っておきたいChatGPT-4o(オムニ)についての基礎知識

 20240624_ビジネスマンとして知っておきたいChatGPT-4o(オムニ)についての基礎知識

NobuakiOshiro

June 24, 2024
Tweet

More Decks by NobuakiOshiro

Other Decks in Technology

Transcript

  1. Copyright © 2024 NOB DATA All Rights Reserved. 簡単なアンケート Q

    : ChatGPTを使ったことがありますか? 0 : 初めて触る or 昔ちょっと触ったこ とある 1: 無料版を使ってる (ChatGPT-3.5 or 4o) 2: 有料版を契約して 使ってる (ChatGPT-4 or 4o)
  2. Copyright © 2024 NOB DATA All Rights Reserved. 本⽇の流れ OpenAI社のデモ動画も交えつつ、情報共有

    1. ⾃⼰紹介・会社紹介 :3分 2. ⽣成AIの全体像 :5分 3. オムニはこれまでとどう違うのか? :10分 4. オムニの登場で想定される社会的な影響 :10分 5. 質疑応答:20分 ( 12:55までには完全終了)
  3. Copyright © 2024 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(twitter

    @doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会九州⽀部 ⽀部⻑ / iU 情報経営イノベーション専⾨職⼤学 客員教員 ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、 オモシロAIごった煮勉強会、ChatGPT部、 AGI福岡、他2つ 本業ではデータ分析チームの ⽴ち上げ・育成・⾃⾛⽀援を展開中
  4. Copyright © 2024 NOB DATA All Rights Reserved. お試しでサービスも作ってます •

    ChatGPT活⽤の出⼝の⼀つとして、プロダクト化。(ただし、あくまで本業はコンサルティング) • ChatGPT研修->開発⽀援も可能です 開発中AIアシスタント ねぎまさん
  5. Copyright © 2024 NOB DATA All Rights Reserved. ChatGPT部、と⾔う部活動もやってます(⾒学OK) •

    オンラインで有志による ChatGPTの勉強会を開催中 (2024年は第2、第4⼟曜⽇ の朝10-11時) • https://chatgptclub.con npass.com/ • またここからoutputされた内 容についてはnoteにまとめて おります • https://note.com/chatg pt_nobdata/
  6. Copyright © 2024 NOB DATA All Rights Reserved. ⽣成AIは⼤枠のジャンル •

    ⽣成AIには複数の種類があります • ⾔語⽣成系AI : ChatGPTを始めとした⼤規模⾔語系の⽣成AI (LLMと呼ばれます、後ほどもう少し詳しく解説) • 画像⽣成系AI : Stable DiffusionやMidjourneyなど • 動画⽣成系AI : OpenAI Sora(⼀般公開前)やLuma.AIなど • ⾳楽⽣成系AI : Suno.AIなど • ⾳声⽣成系AI : OpenAIのChatGPT-4o(オムニ)のイチ機能。 ただ、⾳声対話は⼀般公開前 などなど。 • 利⽤環境 • 基本的にはGPUと呼ばれる計算チップを持ったPC・サーバが必要な ため、クラウドサービスとして展開されています。 ( ⼀部、⼿元のマシンで動くオープンソース版のソフトウェアもありますが、ハードル は⾼め。 ) • サービスへの組み込みはOpenAI APIやMicrosoft AzureのAPIを使う⽅法が主流
  7. Copyright © 2024 NOB DATA All Rights Reserved. ⽣成AIの汎⽤性・特徴 •

    ⽣成AIの汎⽤性 • ⽣成AIは従来の特化型AIと異なり、1つのモデル(AI)で「⽐較的汎⽤的」な利⽤が可能です • 従来の特化型AIは1個1個を数千万円〜数億円で構築 • ⼤規模⾔語モデル(LLM)などは1個のモデルを⼤量のデータで学習 (基盤モデルを構築するのには数千億円〜1兆円以上かかると⾔われています) • そのため、OpenAIやGoogleなどのアメリカ陣営、または中国陣営の独壇場となっています -> 我々としてはユーザーとしてChatGPTなどを使う⽴場 • 現時点での⽣成AIの最⼤の弱点 • 「嘘の情報(ハルシネーション)」「破綻した映像」などの出⼒がまだまだあります • 「確率的に⽣成」しているので、ガチャ要素が強い • この辺りを⼀定制御するのが「プロンプティング」と呼ばれる書き⽅です。 (ただし、基本は試⾏錯誤です) • さらに未来 • ⽣成AIがさらに進化すると、汎⽤⼈⼯知能(AGI)や⼈⼯超知能(SAI)が実現するのでは、とも期待され ています • 国内だとソフトバンクの孫さんはその未来に向けてベッドし続けているお⼀⼈(後述)
  8. Copyright © 2024 NOB DATA All Rights Reserved. 参考:AGI実現に向けてのソフトバンク社の動き •

    国内ではソフトバンクの孫さんがAGI時代に向けて準備を加速している ( もちろん、実現するかどうかは現時点では不明。ただし、実現した際のインパクトは莫⼤ ) 引⽤、⽇経新聞記事(2024/6/21) https://www.nikkei.com/article/DGXZQOUB2171N0R20C24A60 00000/ 引⽤、神⽥さんのヤフー記事(2023/6/22): https://news.yahoo.co.jp/expert/articles/24d6c73a5efa 3be448d0a34e2eb4fc6baa002fd8
  9. Copyright © 2024 NOB DATA All Rights Reserved. ⼤規模⾔語モデルで有名な企業 •

    OpenAI社のChatGPTを筆頭として、 何社か乱⽴しています(我々が使えるの はほぼ、アメリカ企業製品) • 個⼈的にはOpenAI社のChatGPT Plus を契約して使っておけば、他の製品の 挙動も⼤体わかると思っています ( 多少の性能差・価格差はありますが、 まだOpenAIがリーダー的存在 ) • 最近ではCloude3なども出てますので、 右の表よりは性能UPしています(未検 証) • なお、中⻑期的にはGoogle、または中 国企業が強くなるかもしれない、とい う予測もあります ( 学習⽤のデータを⼤量に保有してい るため ) 引⽤元:https://ledge.ai/articles/llms_took_the_common_test_2024 Google OpenAI Anthoropic
  10. Copyright © 2024 NOB DATA All Rights Reserved. ChatGPT-4o (オムニ)とは

    • OpenAI社が発表した最新の⾔語系⽣成AI • ChatGPT-3.5 (2022/11末, 初期の⼀般公開サービス) • ChatGPT-4 (2023/3/14頃, 賢さUP) • ChatGPT-4V (ヴィジョン) (2023/11頃, 画像解析機能の追加) • ChatGPT-4o (オムニ) (2024/5/14頃, より⾃然な対話) • オムニは「マルチモーダル」への対応という ことで、より⾃然な対話が可能 (詳しくはOpenAIの公式動画にて) https://openai.com/index/hello-gpt-4o/
  11. Copyright © 2024 NOB DATA All Rights Reserved. 速報的にはこちらのまとめ •

    この内容をもう少し詳しくみ ていきます • 動画はこちら • https://www.youtube .com/watch?v=DQac CB9tDaw&t=1s https://note.com/chatgpt_nobdata/n/n1594446ffd30
  12. Copyright © 2024 NOB DATA All Rights Reserved. 動画視聴の前に:現在のChatGPT-4のアプリ •

    GPT-4o(オムニ)では「より ⾃然な⾳声対話」を実現して います • ⽐較対象として、従来の GPT-4の⾳声対話にはタイム ラグがあるのを感じていただ ければと(2-3秒くらい)。 • なお、2024/5/26現在、まだ オムニの対話機能は⼀般公開 されていません ( 動画でのデモや⾃⺠党会合 でのデモくらい ) ココ ⾳声対話モード 通常モード
  13. Copyright © 2024 NOB DATA All Rights Reserved. まずはOpenAI社のGPT-4o(オムニ)発表動画から •

    リンクはこちら • https://www.youtube.com/ watch?v=DQacCB9tDaw • 動画⾒つつ、抜粋してご説明 • Youtubeで⽇本語への⾃動翻 訳をONにすると便利です ⽇本語 を選択
  14. Copyright © 2024 NOB DATA All Rights Reserved. ① 対話機能のデモ

    (動画の9:43-10:56あたり) • 通常の対話 • 呼吸⾳の認識
  15. Copyright © 2024 NOB DATA All Rights Reserved. ② カットイン&声⾊の変化デモ

    (動画の12:04-13:10あたり) • 物語の作成 • カットイン • 声⾊の変化 • 感情の起伏 • ロボットのように
  16. Copyright © 2024 NOB DATA All Rights Reserved. ④ 前に戻って、デスクトップのリアルタイム認識(20:30あたり)

    • デスクトップの模様をライ ブで認識 • コードレビューやデータ分 析の⽀援
  17. Copyright © 2024 NOB DATA All Rights Reserved. ChatGPT-4o(オムニ)のupdateサマリ •

    ⼀⾔で⾔うと「より⼈間と対話しているかのようなUX」に関するアップデート -> 動画を⾒るのが⼀番⼿っ取り早いですが、以下いくつかキーワードレベルで 回答のスピードが GPT-4よりめっちゃUP (体感4-5倍) 「⾳声」そのままで ⾔語・話者を理解 (これまではテキストに 変換してた) 動画のリアルタイム認識 ( これまでは画像1枚単位 だった ) ⾳声合成の幅がUP (ここはまぁ他の⽣成AIでもでき てたかも・・? ) Mac連携、Win連携 (デスクトップ常駐) GPT-4oの無料公開 (10回/5h、あとそのうちGPTs も使えるようになる)
  18. Copyright © 2024 NOB DATA All Rights Reserved. オムニの登場で想定される社会的な影響 •

    個⼈的にはChatGPT-4o(オムニ)もまだ発展途上の段階だとは思いますが、以 下の業界では⼤きな影響が想定されます • ⾳声対話&画像認識で直接的な影響が想定される分野 • 教育業界 (動画デモあり) • ⾔語学習や通訳などの仕事 / 海外旅⾏でのガイド等 • Win / Mac・iPhone等への組み込みによる変化 • ChatGPTの企業内活⽤ / 研修ニーズの活性化 • 中⻑期的には • ロボティクスとの接続 • ⾳声や画像のデータ解析 / 学習データの収集
  19. Copyright © 2024 NOB DATA All Rights Reserved. 教育での活⽤例 •

    ライブでの発表以外にも、OpenAI 社の公式Webサイトやyoutubeにて 各種デモの模様が紹介されています • Webサイト • https://openai.com/index /hello-gpt-4o/ • Youtube • https://www.youtube.co m/@OpenAI • イチオシしは未来の教育⽅法を彷彿 とさせるこちら (3分くらいの動画です) https://www.youtube.com/watch?v=_nSmkyDNulk
  20. Copyright © 2024 NOB DATA All Rights Reserved. 参考:教育関係の企業の株は下落傾向(英会話のDuolingo等) •

    いくつかの教育関係の株価が 下落(例:duolingo) • ChatGPT-4o(オムニ)の発表 の前に、教育系サービスの CheggのCEOが⽣成AIの影響 によるネガティブ発弁をした のが引き⾦、とのこと • その後、5/14にGPT-4o(オ ムニ)が発表され、株価はま だ完全には戻らない状態
  21. Copyright © 2024 NOB DATA All Rights Reserved. ⾔語学習や通訳などの仕事 /

    海外旅⾏でのガイド等 • 多⾔語での同時通訳、のような仕掛けもほぼ実現可能と⾒られています ( 現在はまだ⾳声のリアルタイム認識のAPIが公開されていないので、影響が出るのはおそらく これから ) • また個⼈のデータベースなどを整備して、「パーソナルのアシスタント」としての役割を果た す⽇もおそらく近いです ( 後述するAppleのiPhoneへの組み込みが現時点では⼀番近い) • 海外旅⾏などで旅の⼿配をしてくれるガイド代わりのサービスが出てくる可能性も⾼いと思い ます グローバルでの⾔語の壁がだいぶ低くなる可能性がある
  22. Copyright © 2024 NOB DATA All Rights Reserved. Win /

    Mac・iPhone等への組み込みによる変化 • OpenAI社はマイクロソフト(MS)やApple はとの提携を⾏なっています • MSはcopilotを、AppleはApple IntelligenceというAIを持っていますが、 裏側は基本はOpenAI社のChatGPTです (多少、調整は⼊っている) • これからはWindowsやMac製品の中にも ⽣成AIが⼊ってきますので、PC内のデー タに基づいた、よりパーソナライズされ た形での⽣成AI活⽤、ということが容易 になると思われます。 (例:カレンダーを⾒て、予定を調整や メールを⾒て返信の優先度が⾼いものを 探す、など) • なお、中⻑期的にはGoogleが対抗⾺です 引⽤: https://news.yahoo.co.jp/articles/be851975fe349fa8012f4f48769d 301881e47806?page=3
  23. Copyright © 2024 NOB DATA All Rights Reserved. ChatGPTの企業内活⽤ /

    研修ニーズの活性化 • ChatGPT-4o(オムニ)は実は、⼀般 のユーザー向けにも無料で⼀定回数 利⽤が可能です ( 私が確認したタイミングでは10回 /5時間 ) • ChatGPTは⽇本語でのやりとりの性 能が英語より低い、ということはよ く⾔われていましたが、 GPT-4oのレベルであれば実⽤上は⼗ 分なレベルです(GPT-3.5だとダメダ メ) • また実際の各社の⽀援の中でも、⽣ 成AIを活⽤した新規事業や研修・セ ミナーニーズ、また 社内のデータと連携した活⽤⽅法な どの声が増えつつある印象です Google trendにて https://trends.google.co.jp/trends/explore?date=2022- 11-01%202024-06-23&geo=JP&q=chatgpt&hl=ja ChatGPT-3.5 GPT-4o(オムニ)発表 サムアルトマン⽒来⽇
  24. Copyright © 2024 NOB DATA All Rights Reserved. 中⻑期的な予測 (ロボティクスや学習データ収集)

    • オムニの1つ前のChatGPT-4V の時代からですが、ChatGPTは 画像の認識も可能です • おそらく今後はロボットなどの ⽬の代わりとして、「どのよう に動作すれば良いか」をある程 度汎⽤的に考えるロボットが出 てくると思われます • また、現在のWeb上の学習デー タだけでは限界があるとも⾔わ れているため、OpenAIやその他 ⽣成AI各社は「⾳声や画像・動 画の学習データ」についても需 要が増すものと想定されます ( AGI / ASI開発に必要なのは、 電⼒・チップ・データ ) 参考:https://arxiv.org/abs/2309.17421