Menormalkan berkas audio dengan PyDub
Terkadang Anda memiliki berkas audio dengan suara yang keras pada beberapa bagian dan pelan pada bagian lainnya. Perbedaan volume ini dapat menghambat transkripsi.
Untungnya, modul effects di PyDub memiliki fungsi normalize() yang mencari volume maksimum dari sebuah AudioSegment, lalu menyesuaikan bagian lain dari AudioSegment agar proporsional. Ini berarti bagian yang pelan akan mendapatkan peningkatan volume.
Anda dapat mendengarkan contoh berkas audio yang awalnya keras lalu menjadi pelan, loud_then_quiet.wav, di sini.
Pada latihan ini, Anda akan menggunakan normalize() untuk menormalkan volume berkas kita, sehingga terdengar lebih seperti ini.
Latihan ini adalah bagian dari kursus
Pemrosesan Bahasa Lisan dengan Python
Petunjuk latihan
- Impor
AudioSegmentdariPyDubdannormalizedari modul effects milikPyDub. - Impor berkas audio target,
loud_then_quiet.wav, lalu simpan keloud_then_quiet. - Normalkan berkas audio yang diimpor menggunakan fungsi
normalize()dan simpan kenormalized_loud_then_quiet.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import AudioSegment and normalize
from pydub import ____
from pydub.effects import ____
# Import target audio file
loud_then_quiet = AudioSegment.from_file(____)
# Normalize target audio file
normalized_loud_then_quiet = ____(____)