IniziaInizia gratis

Tokenizzazione del testo

In questo esercizio userai il dataset flickr, che contiene 30.000 immagini con relative didascalie, per eseguire operazioni di preprocessamento sul testo. Questo è necessario per poterlo usare con i modelli in attività come la classificazione del testo. È particolarmente utile per applicazioni multi-modali, in cui i modelli Hugging Face possono verificare l’adeguatezza di una didascalia rispetto all’immagine associata.

Il dataset (dataset) è stato caricato e AutoTokenizer è stato importato.

Questo esercizio fa parte del corso

Modelli multi-modali con Hugging Face

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the first caption from the image at index 5
text = dataset[5]["____"][0]
print(text)
Modifica ed esegui il codice