1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ音声言語処理

Connected

Exercises

音声を適切なフォーマットに変換する

Acme Studios から、彼らの音声ファイルについて詳しく知るための PoC(概念実証)を依頼されました。

少し調べてみると、いくつか通話データがありますが、文字起こしには不適切なファイル形式で保存されています。

多くの音声ファイルを扱うことになるので、まずはヘルパー関数を作るところから始めます。

最初の関数 convert_to_wav(filename) はファイルパスを受け取り、PyDub を使って非 WAV 形式から .wav 形式へ変換します。

作成できたら、この関数を使って Acme の最初の通話である call_1.mp3 を .mp3 形式から .wav に変換します。

PyDub の AudioSegment クラスはすでにインポート済みです。非 WAV ファイルを扱うには ffmpeg が必要になる点を忘れないでください(docs)。

คำแนะนำ

100 XP
  • AudioSegment の from_file() を使って filename 引数を読み込みます。
  • エクスポート形式を "wav" に設定します。
  • 変換対象の音声ファイル call_1.mp3 を関数に渡します。