Fazendo prompts com arquivos de imagem locais
Você está trabalhando como analista de dados no departamento de transporte de Londres. Sua equipe criou uma visualização que mostra o número de veículos nas vias em diferentes horários e modos de transporte, e você quer usar um modelo de IA para extrair insights principais a partir dela.
A imagem está armazenada localmente como "LDN_2024_traffic.png".
Crédito de imagem e dados: City Streets 2025 Summary Report by the City of London.
Este exercício faz parte do curso
Trabalhando com a OpenAI Responses API
Instruções do exercício
- Importe o módulo
base64para codificar a imagem. - Codifique o arquivo de imagem em base64 usando a função
b64encode()debase64, armazenando o resultado emimage_base64. - Complete a mensagem de entrada da imagem na solicitação para indicar o uso de base64 e usar as codificações base64.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import base64 module
____
# Encode the image file as base64
with open(image_path, "rb") as f:
image_base64 = base64.____(f.read()).decode("utf-8")
# Create a response with text and image input
response = client.responses.create(
model="gpt-5-mini",
input=[
{"role": "user", "content": [
{"type": "input_text", "text": "What mode of transport contributed the highest number of vehicles during business hours? Answer very concisely."},
{"type": "input_image", "image_url": f"data:image/png;____,{____}"}
]}
]
)
print(response.output_text)
visualize_image(image_url)