Przepływ pracy przy przetwarzaniu dźwięku

Wiesz już, jak importować i modyfikować pojedynczy plik audio za pomocą PyDub. Co jednak, jeśli masz folder z wieloma plikami audio do przekonwertowania?

W tym ćwiczeniu użyjemy PyDub, aby przygotować folder plików do użycia z biblioteką speech_recognition.

Okazuje się, że wszystkie pliki z rozmowami klientów mają 3 sekundy szumu na początku i są cichsze, niż powinny być.

Aby to naprawić, użyjemy PyDub do wycięcia szumu, zwiększenia głośności i konwersji plików do formatu .wav.

Przykład niesformatowanego pliku możesz odsłuchać tutaj.

Zacznijmy od jednego pliku. Zaimportuj account_help.mp3 i wytnij pierwsze 3 sekundy (3000 milisekund) szumu na początku.

ćwiczenie

Przepływ pracy przy przetwarzaniu dźwięku

Instrukcje 1/3

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje 1/3

ćwiczenie