ComenzarEmpieza gratis

Creación de prompts con archivos de imagen locales

Trabajas como analista de datos para el departamento de transporte de Londres. Tu equipo ha creado una visualización que muestra el número de vehículos en las carreteras a distintas horas y según diferentes modos de transporte, y quieres usar un modelo de IA para extraer ideas clave de ella.

La imagen está almacenada localmente como "LDN_2024_traffic.png".


Créditos de la imagen y los datos: City Streets 2025 Summary Report by the City of London.

Este ejercicio forma parte del curso

Trabajar con la API Responses de OpenAI

Ver curso

Instrucciones del ejercicio

  • Importa el módulo base64 para codificar el archivo de imagen.
  • Codifica el archivo de imagen a base64 usando la función b64encode() de base64, guardando el resultado en image_base64.
  • Completa el mensaje de entrada de la imagen en la solicitud para indicar el uso de base64 y utilizar las codificaciones base64.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import base64 module
____

# Encode the image file as base64
with open(image_path, "rb") as f:
    image_base64 = base64.____(f.read()).decode("utf-8")

# Create a response with text and image input
response = client.responses.create(
    model="gpt-5-mini",
    input=[
        {"role": "user", "content": [
            {"type": "input_text", "text": "What mode of transport contributed the highest number of vehicles during business hours? Answer very concisely."},
            {"type": "input_image", "image_url": f"data:image/png;____,{____}"}
        ]}
    ]
)

print(response.output_text)
visualize_image(image_url)
Editar y ejecutar código