1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie mowy w Pythonie

Connected

ćwiczenie

Różne rodzaje audio

Wiesz już, jak działa klasa Recognizer. Czas wypróbować kilka dodatkowych przypadków. Co z mową w innym języku?

Co się stanie, gdy wywołamy funkcję recognize_google() na japońskiej wersji pliku good_morning.wav (plik) (japanese_audio)?

Domyślny język to "en-US" – czy wyniki będą takie same z tagiem "ja"?

A co z dźwiękami, które nie są mową? Na przykład ryk leoparda (leopard_audio).

Albo mowa, w której dźwięki mogą nie tworzyć prawdziwych słów – jak w przypadku gaworzącego niemowlęcia (charlie_audio)?

Aby lepiej poznać klasę Recognizer, przyjrzymy się przykładowi każdego z tych przypadków.

Instrukcje 1/4

undefined XP
  • 1

    Przekaż japońską wersję nagrania „dzień dobry" (japanese_audio) do funkcji recognize_google(), używając "en-US" jako języka.

  • 2

    Przekaż to samo japońskie nagranie (japanese_audio), tym razem używając "ja" jako parametru języka. Czy widzisz różnicę?

  • 3

    A co z dźwiękami niebędącymi mową? Przekaż leopard_audio do funkcji recognize_google(), ustawiając show_all na True.

  • 4

    Co się stanie, jeśli plik audio zawiera dźwięki wydawane przez człowieka, ale niebędące mową? Przekaż charlie_audio do funkcji recognize_google() i sprawdź wynik.