1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ音声言語処理

Connected

演習

PyDubで音声パラメータを確認する

扱う音声ファイルには、チャンネル数、フレームレート(サンプルレート)、サンプル幅など、さまざまな特徴があります。

これらのパラメータを把握しておくと、音声認識のAPI要件に音声ファイルが適合しているかを確認できます。

たとえば、多くのAPIは最小フレームレート(wav_file.frame_rate)として16,000 Hzを推奨しています。

AudioSegment のインスタンスを作成すると、PyDub は音声ファイルから自動的にこれらのパラメータを推定し、属性として保持します。

この演習では、これらの属性を確認していきます。

指示1 / 4

undefined XP
  • 1
    • wav_file の frame_rate を調べてください。
  • 2
    • wav_file のチャンネル数を調べてください。
  • 3
    • wav_file の最大振幅を調べてください。
  • 4
    • wav_file の長さ(ミリ秒)を調べてください。