1. Lära sig
  2. /
  3. Courses
  4. /
  5. Xử lý Ngôn ngữ Nói bằng Python

Connected

exercise

Chuẩn hóa một tệp âm thanh với PyDub

Đôi khi bạn sẽ có các tệp âm thanh mà lời nói lúc thì to, lúc thì nhỏ. Sự chênh lệch âm lượng này có thể cản trở việc chuyển lời nói thành văn bản.

May mắn là mô-đun effects của PyDub có hàm normalize() dùng để tìm mức âm lượng lớn nhất của một AudioSegment, rồi điều chỉnh phần còn lại của AudioSegment theo tỷ lệ. Điều này có nghĩa là các đoạn nhỏ sẽ được tăng âm lượng.

Bạn có thể nghe ví dụ về một tệp âm thanh bắt đầu to rồi nhỏ dần, loud_then_quiet.wav, tại đây.

Trong bài tập này, bạn sẽ dùng normalize() để chuẩn hóa âm lượng của tệp, giúp nó nghe giống như thế này hơn.

Instruktioner

100 XP
  • Import AudioSegment từ PyDub và normalize từ mô-đun effects của PyDub.
  • Import tệp âm thanh đích, loud_then_quiet.wav và lưu vào loud_then_quiet.
  • Chuẩn hóa tệp âm thanh đã import bằng hàm normalize() và lưu vào normalized_loud_then_quiet.