Upgrade to Pro — share decks privately, control downloads, hide ads and more …

XRミーティング 20230920

1ft-seabass
September 20, 2023

XRミーティング 20230920

XRミーティング 20230920「XREAL Air で録音して Whisper API で文字起こしした試行錯誤」の登壇資料です。

◆スライド内の素材は以下を使用させていただいております。ありがとうございます!

・シルエットデザイン http://kage-design.com/
・human pictogram 2.0 http://pictogram2.com
・ICOOON MONO http://icooon-mono.com/
・Adobe Stock https://stock.adobe.com/jp

1ft-seabass

September 20, 2023
Tweet

More Decks by 1ft-seabass

Other Decks in Technology

Transcript

  1. XREAL Air から録音して OpenAI Whisper API に送って文字起こしします Microphone で録音 OpenAI

    Whisper API 録音 AudioClip から WAV データ変換 音声データ 文字起こし
  2. Whisper API に Unity から WAV データを送るところ Microphone で録音 OpenAI

    Whisper API 録音 AudioClip から WAV データ変換 音声データ 文字起こし
  3. Whisper API は multipart/form-data 受けだが Unity の標準の送り方が同じで助りました Unity からマイク録音して音データを WAV

    フォーマットで Whisper API に送って文字起こしするメモ https://www.1ft-seabass.jp/memo/2023/09/17/unity-with-whisper-api/
  4. XREAL Air 固有のところ Microphone で録音 OpenAI Whisper API 録音 AudioClip

    から WAV データ変換 音声データ 文字起こし
  5. ➔ WAV フォーマットで送る必要があったが、今回 WAV フォーマットの仕様と仲良くなれたぽいのでよかった ➔ Whisper API に multipart/form-data

    形式で送る知見が うまくハマってよかった ➔ XREAL Air 固有の部分は案外少なくて助かった ➔ HoloLens 2 での至れり尽くせり感をうまく分解してとら えられたのでよかった ➔ これで文字起こししたものを ChatGPT に声で話した質問 を送れるようになると色々と可能性が広がりそう まとめ