Chargement des ensembles de données
Une fois que vous avez sélectionné votre ensemble de données, il est temps de le charger à l'aide de la bibliothèque datasets.
Dans ce cas, vous chargerez la partition "validation" de l'ensemble de données "TIGER-Lab/MMLU-Pro", qui est un ensemble de données d'évaluation de référence.
Le module load_dataset du paquet datasets est déjà chargé pour vous.
Cet exercice fait partie du cours
Travailler avec Hugging Face
Instructions
- Veuillez utiliser la fonction appropriée pour charger l'ensemble de données «
"TIGER-Lab/MMLU-Pro"» et spécifier la division «"validation"».
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the "validation" split of the TIGER-Lab/MMLU-Pro dataset
my_dataset = ____("____", split="____")
# Display dataset details
print(my_dataset)