Inspeccionar conjuntos de datos
Los conjuntos de datos de Hugging Face varían mucho en tamaño, estructura y características, por lo que es importante inspeccionar sus metadatos antes de cargarlos en tu entorno.
Exploremos el conjunto de datos "MMLU-Pro", un punto de referencia con 12.000 preguntas y respuestas multirrespuesta que abarca campos de STEM como Matemáticas e Informática, para comprender sus metadatos, incluidos el tamaño y las características.
Nota: este ejercicio puede tardar un minuto debido al tamaño del conjunto de datos.
Este ejercicio forma parte del curso
Trabajar con Cara Abrazada
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import the function to load dataset metadata
from ____ import load_dataset_builder
# Initialize the dataset builder for the MMLU-Pro dataset
reviews_builder = ____("TIGER-Lab/MMLU-Pro")