Text-to-speech (TTS) da OpenAI
A OpenAI agora fornece modelos para criar fala com som humano a partir de um texto de entrada, o chamado text-to-speech ou TTS. A OpenAI oferece várias vozes para você escolher e permite transmitir a resposta para arquivos locais ou aplicações downstream.
Este exercício faz parte do curso
Sistemas Multimodais com a API da OpenAI
Instruções do exercício
- Crie a solicitação de text-to-speech para
"Hi! How's your day going?", usando a voz"ballad". - Transmita a resposta para um arquivo
.mp3.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
client = OpenAI(api_key="")
# Create the text-to-speech request
response = client.audio.speech.create(
model="gpt-4o-mini-tts",
____,
input="Hi! How's your day going?"
)
# Stream the response to an MP3 file
response.____("output.mp3")