Creación de prompts con archivos de imagen locales
Trabajas como analista de datos para el departamento de transporte de Londres. Tu equipo ha creado una visualización que muestra el número de vehículos en las carreteras a distintas horas y según diferentes modos de transporte, y quieres usar un modelo de IA para extraer ideas clave de ella.
La imagen está almacenada localmente como "LDN_2024_traffic.png".
Créditos de la imagen y los datos: City Streets 2025 Summary Report by the City of London.
Este ejercicio forma parte del curso
Trabajar con la API Responses de OpenAI
Instrucciones del ejercicio
- Importa el módulo
base64para codificar el archivo de imagen. - Codifica el archivo de imagen a base64 usando la función
b64encode()debase64, guardando el resultado enimage_base64. - Completa el mensaje de entrada de la imagen en la solicitud para indicar el uso de base64 y utilizar las codificaciones base64.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import base64 module
____
# Encode the image file as base64
with open(image_path, "rb") as f:
image_base64 = base64.____(f.read()).decode("utf-8")
# Create a response with text and image input
response = client.responses.create(
model="gpt-5-mini",
input=[
{"role": "user", "content": [
{"type": "input_text", "text": "What mode of transport contributed the highest number of vehicles during business hours? Answer very concisely."},
{"type": "input_image", "image_url": f"data:image/png;____,{____}"}
]}
]
)
print(response.output_text)
visualize_image(image_url)