1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Ngôn ngữ Nói bằng Python

Connected

Bài tập

Tham số âm thanh với PyDub

Mỗi tệp âm thanh bạn làm việc sẽ có một số đặc điểm đi kèm, như số kênh (channels), tốc độ khung hình (frame rate hay sample rate), độ rộng mẫu (sample width) và nhiều thông số khác.

Biết rõ các tham số này sẽ giúp bạn đảm bảo tệp âm thanh tương thích với các yêu cầu của API dùng để chuyển giọng nói thành văn bản.

Ví dụ, nhiều API khuyến nghị tốc độ khung hình tối thiểu (wav_file.frame_rate) là 16.000 Hz.

Khi bạn tạo một đối tượng AudioSegment, PyDub sẽ tự động suy ra các tham số này từ tệp âm thanh và lưu chúng dưới dạng thuộc tính.

Trong bài tập này, bạn sẽ khám phá các thuộc tính đó.

Hướng dẫn 1/4

undefined XP
  • 1
    • Tìm frame_rate của wav_file.
  • 2
    • Tìm số lượng kênh của wav_file.
  • 3
    • Tìm biên độ lớn nhất của wav_file.
  • 4
    • Tìm độ dài của wav_file theo mili giây.