Text-to-speech (TTS) di OpenAI
OpenAI ora mette a disposizione modelli per creare parlato naturale a partire da un input testuale, i cosiddetti sistemi di text-to-speech o TTS. OpenAI offre diverse voci tra cui scegliere e consente di trasmettere la risposta su file locali o ad applicazioni a valle.
Questo esercizio fa parte del corso
Sistemi multimodali con l'API di OpenAI
Istruzioni dell'esercizio
- Crea la richiesta di text-to-speech per
"Hi! How's your day going?", usando la voce"ballad". - Trasmetti la risposta in un file
.mp3.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
client = OpenAI(api_key="")
# Create the text-to-speech request
response = client.audio.speech.create(
model="gpt-4o-mini-tts",
____,
input="Hi! How's your day going?"
)
# Stream the response to an MP3 file
response.____("output.mp3")