Aan de slagGa gratis aan de slag

OpenAI's text-to-speech (TTS)

OpenAI biedt nu modellen om natuurlijke spraak te genereren uit tekstinvoer, zogenoemde text-to-speech of TTS. OpenAI biedt meerdere stemmen om uit te kiezen en maakt het mogelijk om de respons te streamen naar lokale bestanden of downstream-applicaties.

Deze oefening maakt deel uit van de cursus

Multimodale systemen met de OpenAI API

Cursus bekijken

Oefeninstructies

  • Maak het text-to-speech-verzoek voor "Hi! How's your day going?" met de "ballad"-stem.
  • Stream de respons naar een .mp3-bestand.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

client = OpenAI(api_key="")

# Create the text-to-speech request
response = client.audio.speech.create(
  model="gpt-4o-mini-tts",
  ____,
  input="Hi! How's your day going?"
)

# Stream the response to an MP3 file
response.____("output.mp3")
Code bewerken en uitvoeren