LoslegenKostenlos starten

OpenAIs Text-to-Speech (TTS)

OpenAI stellt jetzt Modelle bereit, die aus Texteingaben natürlich klingende Sprache erzeugen – sogenannte Text-to-Speech oder TTS. OpenAI bietet mehrere auswählbare Stimmen und die Möglichkeit, die Antwort in lokale Dateien oder nachgelagerte Anwendungen zu streamen.

Diese Übung ist Teil des Kurses

<Kurs>Multimodale Systeme mit der OpenAI API</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle die Text-to-Speech-Anfrage für "Hi! How's your day going?" mit der Stimme "ballad".
  • Strecke die Antwort in eine .mp3-Datei.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

client = OpenAI(api_key="")

# Create the text-to-speech request
response = client.audio.speech.create(
  model="gpt-4o-mini-tts",
  ____,
  input="Hi! How's your day going?"
)

# Stream the response to an MP3 file
response.____("output.mp3")
Code bearbeiten und ausführen