音声処理のワークフロー

これまでに、PyDub を使って単一の音声ファイルをインポートして操作する方法を見てきました。では、変換が必要な音声ファイルが複数入ったフォルダがあったらどうしますか？

この演習では、PyDub を使って、フォルダ内のファイル群を speech_recognition で使える形式に整えます。

お客様の通話ファイルは、冒頭に3秒のホワイトノイズがあり、音量も小さいことが分かりました。

これを修正するために、PyDub でノイズ部分をカットし、音量を上げ、拡張子を .wav に変換します。

未加工の例はこちらから再生できます。

まずは1つのファイルから始めましょう。account_help.mp3 をインポートし、最初の3秒（3000ミリ秒）のノイズをカットしてください。

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}演習