Tokenización de texto
En este ejercicio, utilizarás el conjunto de datos flickr, que contiene 30 000 imágenes y sus correspondientes pies de foto, para realizar operaciones de preprocesamiento de texto. Esto es necesario para que los modelos lo utilicen en tareas como la clasificación de textos. Esto resulta especialmente útil para aplicaciones multimodales en las que se pueden utilizar los modelos de Hugging Face para comprobar la idoneidad de los subtítulos para una imagen asociada.
Se ha cargado el conjunto de datos (dataset) y se ha importado el archivo « AutoTokenizer ».
Este ejercicio forma parte del curso
Modelos multimodales con Hugging Face
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load the first caption from the image at index 5
text = dataset[5]["____"][0]
print(text)