Datensätze inspizieren
Die Datensätze auf Hugging Face unterscheiden sich stark in Größe, Struktur und Merkmalen, weshalb es wichtig ist, ihre Metadaten zu überprüfen, bevor du sie in deine Umgebung lädst.
Untersuchen wir den "MMLU-Pro"-Datensatz, einen Benchmark mit 12.000 Multi-Choice-Fragen und Antworten aus STEM Bereichen wie Mathematik und Informatik, um seine Metadaten, einschließlich Größe und Merkmale, zu verstehen.
Hinweis: Diese Übung kann aufgrund der Größe des Datensatzes eine Minute dauern.
Diese Übung ist Teil des Kurses
Arbeiten mit Hugging Face
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Import the function to load dataset metadata
from ____ import load_dataset_builder
# Initialize the dataset builder for the MMLU-Pro dataset
reviews_builder = ____("TIGER-Lab/MMLU-Pro")