Erste SchritteKostenlos loslegen

Datensätze inspizieren

Die Datensätze auf Hugging Face unterscheiden sich stark in Größe, Struktur und Merkmalen, weshalb es wichtig ist, ihre Metadaten zu überprüfen, bevor du sie in deine Umgebung lädst.

Untersuchen wir den "MMLU-Pro"-Datensatz, einen Benchmark mit 12.000 Multi-Choice-Fragen und Antworten aus STEM Bereichen wie Mathematik und Informatik, um seine Metadaten, einschließlich Größe und Merkmale, zu verstehen.

Hinweis: Diese Übung kann aufgrund der Größe des Datensatzes eine Minute dauern.

Diese Übung ist Teil des Kurses

Arbeiten mit Hugging Face

Kurs anzeigen

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Import the function to load dataset metadata
from ____ import load_dataset_builder

# Initialize the dataset builder for the MMLU-Pro dataset
reviews_builder = ____("TIGER-Lab/MMLU-Pro")
Bearbeiten und Ausführen von Code