Eine Nicht-Englisch-Sprache transkribieren
OpenAIs Audiomodelle können nicht nur englische Sprache transkribieren, sondern liefern auch bei vielen anderen Sprachen gute Ergebnisse.
In dieser Übung erstellst du ein Transkript aus audio.m4a, das gesprochene Sprache auf Portugiesisch enthält.
Diese Übung ist Teil des Kurses
Multimodale Systeme mit der OpenAI API
Anleitung zur Übung
- Öffne die Datei
audio.m4aim Read-Binary-Modus (rb). - Erstelle eine Transkriptionsanfrage an den Audio-Endpunkt.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
client = OpenAI(api_key="")
# Open the audio.m4a file
audio_file = ____("____", "____")
# Create a transcript from the audio file
response = client.audio.transcriptions.____(model="whisper-1", file=____)
print(response.text)