Audio mit nur einer Zeile transkribieren
Okay, jetzt, wo du Funktionen hast, um Audiodateien zu konvertieren und ihre Attribute zu ermitteln, ist es Zeit, eine Funktion zu bauen, die sie transkribiert.
In dieser Übung erstellst du transcribe_audio(). Die Funktion nimmt einen filename als Eingabe, lädt den filename über die AudioFile-Klasse von speech_recognition und transkribiert ihn anschließend mit recognize_google().
Diese Funktionen hast du schon gesehen, aber jetzt setzen wir sie zu einer leicht wiederverwendbaren Funktion zusammen.
Zum Testen transkribieren wir Acmes ersten Anruf, "call_1.wav".
speech_recognition wurde als sr importiert.
Diese Übung ist Teil des Kurses
Verarbeitung gesprochener Sprache in Python
Anleitung zur Übung
- Definiere eine Funktion namens
transcribe_audio, diefilenameals Eingabeparameter erhält. - Richte eine
Recognizer()-Instanz alsrecognizerein. - Verwende
recognize_google(), um die Audiodaten zu transkribieren. - Übergib den Zielanruf an die Funktion.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
____ ____(____):
"""Takes a .wav format audio file and transcribes it to text."""
# Setup a recognizer instance
____ = sr.Recognizer()
# Import the audio file and convert to audio data
audio_file = sr.AudioFile(filename)
with audio_file as source:
audio_data = recognizer.record(source)
# Return the transcribed text
return recognizer.____(audio_data)
# Test the function
print(transcribe_audio(____))