OpenAIs Text-to-Speech (TTS)
OpenAI stellt jetzt Modelle bereit, die aus Texteingaben natürlich klingende Sprache erzeugen – sogenannte Text-to-Speech oder TTS. OpenAI bietet mehrere auswählbare Stimmen und die Möglichkeit, die Antwort in lokale Dateien oder nachgelagerte Anwendungen zu streamen.
Diese Übung ist Teil des Kurses
<Kurs>Multimodale Systeme mit der OpenAI API</Kurs>Übungsanweisungen
- Erstelle die Text-to-Speech-Anfrage für
"Hi! How's your day going?"mit der Stimme"ballad". - Strecke die Antwort in eine
.mp3-Datei.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
client = OpenAI(api_key="")
# Create the text-to-speech request
response = client.audio.speech.create(
model="gpt-4o-mini-tts",
____,
input="Hi! How's your day going?"
)
# Stream the response to an MP3 file
response.____("output.mp3")