ComeçarComece de graça

Fazendo prompts com arquivos de imagem locais

Você está trabalhando como analista de dados no departamento de transporte de Londres. Sua equipe criou uma visualização que mostra o número de veículos nas vias em diferentes horários e modos de transporte, e você quer usar um modelo de IA para extrair insights principais a partir dela.

A imagem está armazenada localmente como "LDN_2024_traffic.png".


Crédito de imagem e dados: City Streets 2025 Summary Report by the City of London.

Este exercício faz parte do curso

Trabalhando com a OpenAI Responses API

Ver curso

Instruções do exercício

  • Importe o módulo base64 para codificar a imagem.
  • Codifique o arquivo de imagem em base64 usando a função b64encode() de base64, armazenando o resultado em image_base64.
  • Complete a mensagem de entrada da imagem na solicitação para indicar o uso de base64 e usar as codificações base64.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import base64 module
____

# Encode the image file as base64
with open(image_path, "rb") as f:
    image_base64 = base64.____(f.read()).decode("utf-8")

# Create a response with text and image input
response = client.responses.create(
    model="gpt-5-mini",
    input=[
        {"role": "user", "content": [
            {"type": "input_text", "text": "What mode of transport contributed the highest number of vehicles during business hours? Answer very concisely."},
            {"type": "input_image", "image_url": f"data:image/png;____,{____}"}
        ]}
    ]
)

print(response.output_text)
visualize_image(image_url)
Editar e executar o código