LoslegenKostenlos loslegen

Audio mit nur einer Zeile transkribieren

Okay, jetzt, wo du Funktionen hast, um Audiodateien zu konvertieren und ihre Attribute zu ermitteln, ist es Zeit, eine Funktion zu bauen, die sie transkribiert.

In dieser Übung erstellst du transcribe_audio(). Die Funktion nimmt einen filename als Eingabe, lädt den filename über die AudioFile-Klasse von speech_recognition und transkribiert ihn anschließend mit recognize_google().

Diese Funktionen hast du schon gesehen, aber jetzt setzen wir sie zu einer leicht wiederverwendbaren Funktion zusammen.

Zum Testen transkribieren wir Acmes ersten Anruf, "call_1.wav".

speech_recognition wurde als sr importiert.

Diese Übung ist Teil des Kurses

Verarbeitung gesprochener Sprache in Python

Kurs anzeigen

Anleitung zur Übung

  • Definiere eine Funktion namens transcribe_audio, die filename als Eingabeparameter erhält.
  • Richte eine Recognizer()-Instanz als recognizer ein.
  • Verwende recognize_google(), um die Audiodaten zu transkribieren.
  • Übergib den Zielanruf an die Funktion.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

____ ____(____):
  """Takes a .wav format audio file and transcribes it to text."""
  # Setup a recognizer instance
  ____ = sr.Recognizer()
  
  # Import the audio file and convert to audio data
  audio_file = sr.AudioFile(filename)
  with audio_file as source:
    audio_data = recognizer.record(source)
  
  # Return the transcribed text
  return recognizer.____(audio_data)

# Test the function
print(transcribe_audio(____))
Code bearbeiten und ausführen