IniziaInizia gratis

Text-to-speech (TTS) di OpenAI

OpenAI ora mette a disposizione modelli per creare parlato naturale a partire da un input testuale, i cosiddetti sistemi di text-to-speech o TTS. OpenAI offre diverse voci tra cui scegliere e consente di trasmettere la risposta su file locali o ad applicazioni a valle.

Questo esercizio fa parte del corso

Sistemi multimodali con l'API di OpenAI

Visualizza il corso

Istruzioni dell'esercizio

  • Crea la richiesta di text-to-speech per "Hi! How's your day going?", usando la voce "ballad".
  • Trasmetti la risposta in un file .mp3.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

client = OpenAI(api_key="")

# Create the text-to-speech request
response = client.audio.speech.create(
  model="gpt-4o-mini-tts",
  ____,
  input="Hi! How's your day going?"
)

# Stream the response to an MP3 file
response.____("output.mp3")
Modifica ed esegui il codice