ComeçarComece de graça

Text-to-speech (TTS) da OpenAI

A OpenAI agora fornece modelos para criar fala com som humano a partir de um texto de entrada, o chamado text-to-speech ou TTS. A OpenAI oferece várias vozes para você escolher e permite transmitir a resposta para arquivos locais ou aplicações downstream.

Este exercício faz parte do curso

Sistemas Multimodais com a API da OpenAI

Ver curso

Instruções do exercício

  • Crie a solicitação de text-to-speech para "Hi! How's your day going?", usando a voz "ballad".
  • Transmita a resposta para um arquivo .mp3.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

client = OpenAI(api_key="")

# Create the text-to-speech request
response = client.audio.speech.create(
  model="gpt-4o-mini-tts",
  ____,
  input="Hi! How's your day going?"
)

# Stream the response to an MP3 file
response.____("output.mp3")
Editar e executar o código