Tokenisation de texte
Dans cet exercice, vous utiliserez l'ensemble de données flickr, qui contient 30 000 images et leurs légendes, pour effectuer des opérations de prétraitement sur du texte. Ceci est nécessaire pour être utilisé par les modèles pour des tâches telles que la classification de texte. Ceci est particulièrement utile pour les applications multimodales où les modèles Hugging Face peuvent être utilisés pour vérifier la pertinence des légendes d'une image associée.
L'ensemble de données (dataset
) a été chargé et l'AutoTokenizer
a été importé.
Cet exercice fait partie du cours
Modèles multimodaux avec Hugging Face
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the first caption from the image at index 5
text = dataset[5]["____"][0]
print(text)