ComenzarEmpieza gratis

Manipulación de conjuntos de datos

Es muy probable que en muchas ocasiones necesites manipular un conjunto de datos antes de usarlo en una tarea de Machine Learning. Dos operaciones comunes son filtrar y seleccionar (o hacer slicing). Dado el tamaño de estos conjuntos, Hugging Face utiliza tipos de archivo Arrow.

Esto implica que realizar estas manipulaciones es un poco diferente a lo que quizá estés acostumbrado. Por suerte, ¡ya existen métodos que te ayudan con esto!

El conjunto de datos ya está cargado para ti en wikipedia.

Este ejercicio forma parte del curso

Trabajar con Hugging Face

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Filter the documents
____ = wikipedia.____(lambda row: "football" in row["____"])

# Create a sample dataset
example = ____.____(range(1))

print(example[0]["text"])
Editar y ejecutar código