Alur kerja pemrosesan audio
Anda telah melihat cara mengimpor dan memanipulasi satu berkas audio menggunakan PyDub. Namun bagaimana jika Anda memiliki sebuah folder dengan banyak berkas audio yang perlu dikonversi?
Dalam latihan ini kita akan menggunakan PyDub untuk memformat satu folder berkas agar siap digunakan dengan speech_recognition.
Anda menemukan bahwa semua rekaman panggilan pelanggan memiliki 3 detik derau statis di awal dan volumenya lebih pelan dari seharusnya.
Untuk memperbaikinya, kita akan menggunakan PyDub untuk memotong derau statis, menaikkan tingkat suara, dan mengonversinya ke ekstensi .wav.
Anda dapat mendengarkan contoh yang belum diformat di sini.
Latihan ini adalah bagian dari kursus
Pemrosesan Bahasa Lisan dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
file_with_static = AudioSegment.from_file(____)
# Cut the first 3-seconds of static off
file_without_static = file_with_static[____:]