1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶ音声言語処理

Connected

연습 문제

1行で音声を書き起こす

さて、音声ファイルを変換して属性を取得する関数は準備できました。次は、それらを文字起こしする関数を作りましょう。

この演習では、filename を受け取り、speech_recognition の AudioFile クラスでその filename を読み込み、recognize_google() で文字起こしする transcribe_audio() を作成します。

これらの関数はすでに見てきましたが、今回は関数にまとめて使いやすくします。

試すために、Acme の最初の通話、"call_1.wav" を文字起こしします。

speech_recognition は sr としてインポート済みです。

지침

100 XP
  • 入力パラメータとして filename を受け取る transcribe_audio 関数を定義します。
  • Recognizer() のインスタンスを recognizer として用意します。
  • recognize_google() を使って音声データを文字起こしします。
  • 対象の通話ファイルを関数に渡して実行します。