1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przetwarzanie mowy w Pythonie

Connected

ćwiczenie

Od AudioFile do AudioData

Jak już widziałeś(-aś) wcześniej, dane audio wymagają kilku kroków przekształcenia, zanim będzie można je efektywnie wykorzystać. Podobnie jest w przypadku biblioteki SpeechRecognition.

W tym ćwiczeniu zaimportujesz plik audio clean_support_call.wav (pobierz tutaj) i przygotowujesz go do rozpoznawania mowy.

Plik audio wczytujemy za pomocą klasy AudioFile. Jednak metoda recognize_google() wymaga danych w formacie AudioData.

Aby przekonwertować obiekt AudioFile na AudioData, użyjemy metody record() klasy Recognizer wraz z menedżerem kontekstu. Metoda record() przyjmuje obiekt AudioFile i przekształca go w AudioData, gotowy do użycia z metodą recognize_google().

Biblioteka SpeechRecognition została już zaimportowana jako sr.

Instrukcje

100 XP
  • Przekaż do klasy AudioFile plik clean_support_call.wav.
  • Użyj menedżera kontekstu, aby otworzyć i odczytać clean_support_call jako source.
  • Nagraj source i uruchom kod.