1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie mowy w Pythonie

Connected

ćwiczenie

Praca z zaszumionym dźwiękiem

W tym ćwiczeniu zaczniemy od transkrypcji czystej próbki mowy na tekst, a następnie sprawdzimy, co się stanie po dodaniu szumu tła.

Czysta próbka audio została zaimportowana jako clean_support_call.

Odtwórz czystą rozmowę z pomocą techniczną.

Następnie zrobimy to samo z zaszumionym plikiem audio zapisanym jako noisy_support_call. Zawiera tę samą mowę co clean_support_call, ale z dodatkowym szumem tła.

Odtwórz zaszumioną rozmowę z pomocą techniczną.

Aby spróbować zniwelować szum tła, skorzystamy z funkcji adjust_for_ambient_noise() klasy Recognizer.

Instrukcje 1/4

undefined XP
  • 1

    Wykonaj transkrypcję czystego audio. Wczytaj clean_support_call jako źródło i wywołaj na nim metodę recognize_google().

  • 2

    Zrób to samo co poprzednio, ale tym razem użyj zaszumionego pliku audio zapisanego jako noisy_support_call i ustaw parametr show_all na True.

  • 3

    Ustaw parametr duration funkcji adjust_for_ambient_noise() na 1 (sekundę), aby obiekt recognizer dostosował się do szumu tła.

  • 4

    Wartość duration równa 1 była zbyt długa i spowodowała obcięcie fragmentu nagrania. Spróbuj ustawić duration na 0.5.