OpenAI's text-to-speech (TTS)
OpenAI biedt nu modellen om natuurlijke spraak te genereren uit tekstinvoer, zogenoemde text-to-speech of TTS. OpenAI biedt meerdere stemmen om uit te kiezen en maakt het mogelijk om de respons te streamen naar lokale bestanden of downstream-applicaties.
Deze oefening maakt deel uit van de cursus
Multimodale systemen met de OpenAI API
Oefeninstructies
- Maak het text-to-speech-verzoek voor
"Hi! How's your day going?"met de"ballad"-stem. - Stream de respons naar een
.mp3-bestand.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
client = OpenAI(api_key="")
# Create the text-to-speech request
response = client.audio.speech.create(
model="gpt-4o-mini-tts",
____,
input="Hi! How's your day going?"
)
# Stream the response to an MP3 file
response.____("output.mp3")