1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Huấn luyện Mô hình AI Hiệu quả với PyTorch

Connected

Cvičení

Tiền xử lý bộ dữ liệu âm thanh

Bạn đang nâng cấp ứng dụng nông nghiệp chính xác bằng cách cho phép nông dân điều khiển máy móc bằng lệnh giọng nói. Hệ thống cần nhận diện từ khóa trong các câu lệnh như "Turn on the sprinkler irrigation system."

Bạn sẽ tận dụng một bộ dữ liệu phát hiện từ khóa với các đoạn âm thanh chứa những từ như "on". Hãy tiền xử lý các tệp âm thanh để có thể dùng với một mô hình Transformer được huấn luyện sẵn!

Một số dữ liệu đã được nạp sẵn:

  • dataset chứa một tập dữ liệu huấn luyện mẫu gồm các tệp âm thanh. Nó đã có sẵn phần train, nên bạn không cần chỉ định train khi dùng dataset.
  • AutoFeatureExtractor đã được import từ transformers.
  • model bằng facebook/wav2vec2-base.
  • max_duration được đặt là 1 giây.

Pokyny

100 XP
  • Tải feature_extractor đã được huấn luyện sẵn bằng lớp AutoFeatureExtractor.
  • Đặt sampling_rate dựa trên tần số lấy mẫu từ feature_extractor.
  • Đặt max_length cho audio_arrays bằng max_duration.