LoslegenKostenlos loslegen

Erstellung von Pipeline-Bildunterschriften

In dieser Übung wirst du wieder den Flickr -Datensatz verwenden, der 30.000 Bilder und dazugehörige Bildunterschriften enthält. Jetzt machst du eine Bildunterschrift für das folgende Bild, indem du eine Pipeline anstelle der automatischen Klassen verwendest.

Foto von einem Mann, der auf einer Leiter steht und ein Fenster putzt

Der Datensatz (dataset) wurde mit folgender Struktur geladen:

Dataset({
    features: ['image', 'caption', 'sentids', 'split', 'img_id', 'filename'],
    num_rows: 10
})

Das Pipeline-Modul (pipeline) wurde geladen.

Diese Übung ist Teil des Kurses

Multimodale Modelle mit Hugging Face

Kurs anzeigen

Anleitung zur Übung

  • Lade die Pipeline „ image-to-text “ mit dem vortrainierten Modell „ Salesforce/blip-image-captioning-base “.
  • Verwende die Pipeline, um eine Bildunterschrift für das Bild mit dem Index „ 3 “ zu erstellen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the image-to-text pipeline
pipe = pipeline(task="____", model="____")

# Use the pipeline to generate a caption with the image of datapoint 3
pred = ____(dataset[3]["____"])

print(pred)
Code bearbeiten und ausführen