1. Learn
  2. /
  3. Courses
  4. /
  5. OpenAI APIで学ぶマルチモーダルシステム

Connected

Exercise

ポッドキャストの文字起こしを作成する

OpenAI API の Audio エンドポイントでは、音声認識(speech-to-text)の文字起こしや翻訳に使える各種モデルにアクセスできます。この演習では、OpenAI Developer の Logan Kilpatrick が出演する DataFramed ポッドキャスト のエピソードから文字起こしを作成します。

Logan の話をもっと聴きたい方は、エピソード全文「ChatGPT and the OpenAI Developer Ecosystem」もチェックしてみてください。

Instructions

100 XP
  • openai-audio.mp3 ファイルを開きます。
  • audio_file を使って Audio エンドポイントに文字起こしリクエストを作成します。
  • response から文字起こしテキストを抽出して表示します。