Tokenizzazione del testo
In questo esercizio userai il dataset flickr, che contiene 30.000 immagini con relative didascalie, per eseguire operazioni di preprocessamento sul testo. Questo è necessario per poterlo usare con i modelli in attività come la classificazione del testo. È particolarmente utile per applicazioni multi-modali, in cui i modelli Hugging Face possono verificare l’adeguatezza di una didascalia rispetto all’immagine associata.
Il dataset (dataset) è stato caricato e AutoTokenizer è stato importato.
Questo esercizio fa parte del corso
Modelli multi-modali con Hugging Face
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the first caption from the image at index 5
text = dataset[5]["____"][0]
print(text)