Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Realtime API 入門

RioFujimon
November 03, 2024

Realtime API 入門

Kanagawa.swift #1 で発表した Realtime APIに関する入門スライドです。

RioFujimon

November 03, 2024
Tweet

More Decks by RioFujimon

Other Decks in Programming

Transcript

  1. 自己紹介 藤門 莉生(Rio Fujimon) - Sansan株式会社 - 23卒(新卒2年目) - Eight

    の iOSアプリを開発 - X(旧 Twitter):@RioFujimon - iOS開発で主に興味がある領域 - UIKit, SwiftUI - Bluetooth, NFC, Audio, etc
  2. Realtime API 登場以前の問題 Whisper 音声を テキストに 書き起こす テキスト 解析モデル 目的の

    応答を生成 プロセス全体で感情やアクセントが失われたり、遅延が発生
  3. 💡 要点 ・JSON から type を取得 ・type で場合分けを実施 ・response.text.delta の場合、

    delta を取得して表示 ・response.text.done の text を取得して表示
  4. 💡 要点 ・JSON から type を取得 ・type で場合分けを実施 ・response.audio.delta の場合、

    delta を表示 ・response.audio_transcript.delta の delta を表示 ・response.audio_transcript.done の transcript を表示
  5. - https://openai.com/index/introducing-the-realtime-api/ - https://platform.openai.com/docs/guides/realtime?text-generation-quickstart-e xample=stream - https://platform.openai.com/docs/api-reference/realtime-client-events - https://platform.openai.com/docs/api-reference/realtime-server-events -

    https://openai.com/brand/ - https://developer.apple.com/documentation/foundation/urlsessionwebsocketd elegate - https://developer.apple.com/documentation/foundation/urlsessionwebsocketta sk - https://github.com/m1guelpf/swift-realtime-openai 参考リンク