OpenAIs Text-to-Speech (TTS)
OpenAI stellt jetzt Modelle bereit, die aus Texteingaben natürlich klingende Sprache erzeugen – sogenannte Text-to-Speech oder TTS. OpenAI bietet mehrere auswählbare Stimmen und die Möglichkeit, die Antwort in lokale Dateien oder nachgelagerte Anwendungen zu streamen.
Diese Übung ist Teil des Kurses
Multimodale Systeme mit der OpenAI API
Anleitung zur Übung
- Erstelle die Text-to-Speech-Anfrage für
"Hi! How's your day going?"mit der Stimme"ballad". - Strecke die Antwort in eine
.mp3-Datei.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
client = OpenAI(api_key="")
# Create the text-to-speech request
response = client.audio.speech.create(
model="gpt-4o-mini-tts",
____,
input="Hi! How's your day going?"
)
# Stream the response to an MP3 file
response.____("output.mp3")