LoslegenKostenlos loslegen

OpenAIs Text-to-Speech (TTS)

OpenAI stellt jetzt Modelle bereit, die aus Texteingaben natürlich klingende Sprache erzeugen – sogenannte Text-to-Speech oder TTS. OpenAI bietet mehrere auswählbare Stimmen und die Möglichkeit, die Antwort in lokale Dateien oder nachgelagerte Anwendungen zu streamen.

Diese Übung ist Teil des Kurses

Multimodale Systeme mit der OpenAI API

Kurs anzeigen

Anleitung zur Übung

  • Erstelle die Text-to-Speech-Anfrage für "Hi! How's your day going?" mit der Stimme "ballad".
  • Strecke die Antwort in eine .mp3-Datei.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

client = OpenAI(api_key="")

# Create the text-to-speech request
response = client.audio.speech.create(
  model="gpt-4o-mini-tts",
  ____,
  input="Hi! How's your day going?"
)

# Stream the response to an MP3 file
response.____("output.mp3")
Code bearbeiten und ausführen