1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie mowy w Pythonie

Connected

ćwiczenie

Wielu mówców 1

Jeśli chcesz transkrybować rozmowy, będzie w nich więcej niż jeden mówca. Jak zaraz zobaczysz, funkcja recognize_google() transkrybuje całą mowę jako jeden blok tekstu.

W tym pliku audio można usłyszeć trzech różnych mówców.

Jeśli jednak przeprowadzisz transkrypcję samodzielnie, recognize_google() zwróci jeden blok tekstu. To wciąż przydatne, ale nie wskazuje, który mówca powiedział co.

Alternatywne podejście poznasz w następnym ćwiczeniu.

Plik audio z wieloma mówcami został zaimportowany i przekonwertowany do formatu AudioData jako multiple_speakers.

Instrukcje

100 XP
  • Utwórz instancję klasy Recognizer.
  • Rozpoznaj mowę z zmiennej multiple_speakers za pomocą funkcji recognize_google().
  • Ustaw język na angielski (USA) ("en-US").