1. 学ぶ
  2. /
  3. コース
  4. /
  5. PyTorch による効率的な AI モデルトレーニング

Connected

演習

音声データセットの前処理

精密農業アプリケーションを拡張し、農家が音声コマンドで機械を操作できるようにしましょう。このシステムは、「Turn on the sprinkler irrigation system.」のようなコマンドからキーワードを認識する必要があります。

「on」などのキーワードの音声クリップを含む、キーワード検出データセットを活用します。事前学習済みの Transformer モデルで使用できるよう、音声ファイルを前処理しましょう。

以下のデータはあらかじめ読み込まれています。

  • dataset には音声ファイルのサンプル訓練データセットが含まれています。すでに train スプリットが含まれているため、dataset を使用する際に train を指定する必要はありません。
  • AutoFeatureExtractor は transformers からインポート済みです。
  • model は facebook/wav2vec2-base に設定されています。
  • max_duration は 1 秒として定義されています。

指示

100 XP
  • AutoFeatureExtractor クラスを使って、事前学習済みの feature_extractor を読み込みましょう。
  • feature_extractor のサンプリングレートを使って sampling_rate を設定しましょう。
  • max_duration を使って audio_arrays の max_length を設定しましょう。