LoslegenKostenlos loslegen

Prompting mit lokalen Bilddateien

Du arbeitest als Data Analyst bei der Verkehrsbehörde Londons. Dein Team hat eine Visualisierung erstellt, die die Anzahl der Fahrzeuge zu verschiedenen Zeiten und über verschiedene Verkehrsmittel hinweg zeigt, und du möchtest ein KI-Modell nutzen, um zentrale Erkenntnisse daraus zu gewinnen.

Das Bild ist lokal als "LDN_2024_traffic.png" gespeichert.


Bild- und Datenquelle: City Streets 2025 Summary Report der City of London.

Diese Übung ist Teil des Kurses

Arbeiten mit der OpenAI Responses API

Kurs anzeigen

Anleitung zur Übung

  • Importiere das Modul base64, um die Bilddatei zu kodieren.
  • Kodiere die Bilddatei als Base64 mit der Funktion b64encode() aus base64 und speichere das Ergebnis in image_base64.
  • Vervollständige die Bild-Eingabenachricht in der Anfrage, um die Nutzung von Base64 zu kennzeichnen und die Base64-Kodierung zu verwenden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import base64 module
____

# Encode the image file as base64
with open(image_path, "rb") as f:
    image_base64 = base64.____(f.read()).decode("utf-8")

# Create a response with text and image input
response = client.responses.create(
    model="gpt-5-mini",
    input=[
        {"role": "user", "content": [
            {"type": "input_text", "text": "What mode of transport contributed the highest number of vehicles during business hours? Answer very concisely."},
            {"type": "input_image", "image_url": f"data:image/png;____,{____}"}
        ]}
    ]
)

print(response.output_text)
visualize_image(image_url)
Code bearbeiten und ausführen