1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie mowy w Pythonie

Connected

ćwiczenie

Przepływ pracy przy przetwarzaniu dźwięku

Wiesz już, jak importować i modyfikować pojedynczy plik audio za pomocą PyDub. Co jednak, jeśli masz folder z wieloma plikami audio do przekonwertowania?

W tym ćwiczeniu użyjemy PyDub, aby przygotować folder plików do użycia z biblioteką speech_recognition.

Okazuje się, że wszystkie pliki z rozmowami klientów mają 3 sekundy szumu na początku i są cichsze, niż powinny być.

Aby to naprawić, użyjemy PyDub do wycięcia szumu, zwiększenia głośności i konwersji plików do formatu .wav.

Przykład niesformatowanego pliku możesz odsłuchać tutaj.

Instrukcje 1/3

undefined XP
    1
    2
    3

Zacznijmy od jednego pliku. Zaimportuj account_help.mp3 i wytnij pierwsze 3 sekundy (3000 milisekund) szumu na początku.