MulaiMulai sekarang secara gratis

Menormalkan berkas audio dengan PyDub

Terkadang Anda memiliki berkas audio dengan suara yang keras pada beberapa bagian dan pelan pada bagian lainnya. Perbedaan volume ini dapat menghambat transkripsi.

Untungnya, modul effects di PyDub memiliki fungsi normalize() yang mencari volume maksimum dari sebuah AudioSegment, lalu menyesuaikan bagian lain dari AudioSegment agar proporsional. Ini berarti bagian yang pelan akan mendapatkan peningkatan volume.

Anda dapat mendengarkan contoh berkas audio yang awalnya keras lalu menjadi pelan, loud_then_quiet.wav, di sini.

Pada latihan ini, Anda akan menggunakan normalize() untuk menormalkan volume berkas kita, sehingga terdengar lebih seperti ini.

Latihan ini adalah bagian dari kursus

Pemrosesan Bahasa Lisan dengan Python

Lihat Kursus

Petunjuk latihan

  • Impor AudioSegment dari PyDub dan normalize dari modul effects milik PyDub.
  • Impor berkas audio target, loud_then_quiet.wav, lalu simpan ke loud_then_quiet.
  • Normalkan berkas audio yang diimpor menggunakan fungsi normalize() dan simpan ke normalized_loud_then_quiet.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import AudioSegment and normalize
from pydub import ____
from pydub.effects import ____

# Import target audio file
loud_then_quiet = AudioSegment.from_file(____)

# Normalize target audio file
normalized_loud_then_quiet = ____(____)
Edit dan Jalankan Kode