Van AudioFile naar AudioData

Zoals je eerder zag, moeten we een paar transformaties uitvoeren om onze audio bruikbaar te maken. Dat geldt ook voor SpeechRecognition.

In deze oefening importeren we het audiodbestand clean_support_call.wav en maken we het klaar om te herkennen.

We lezen eerst ons audiobestand in met de klasse AudioFile. Maar de methode recognize_google() vereist invoer van het type AudioData.

Om onze AudioFile om te zetten naar AudioData, gebruiken we de methode record() van de klasse Recognizer samen met een contextmanager. De methode record() neemt een AudioFile als invoer en zet die om naar AudioData, klaar voor gebruik met recognize_google().

SpeechRecognition is al geïmporteerd als sr.

Deze oefening maakt deel uit van de cursus

Spoken Language Processing in Python

Cursus bekijken

Oefeninstructies

Geef de klasse AudioFile het bestand clean_support_call.wav mee.
Gebruik de contextmanager om clean_support_call te openen en lezen als source.
Neem source op en voer de code uit.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Instantiate Recognizer
recognizer = sr.Recognizer()

# Convert audio to AudioFile
clean_support_call = sr.AudioFile(____)

# Convert AudioFile to AudioData
with ____ as source:
    clean_support_call_audio = recognizer.record(____)

# Transcribe AudioData to text
text = recognizer.recognize_google(clean_support_call_audio,
                                   language="en-US")
print(text)

Code bewerken en uitvoeren