Gegevenssets laden
Nadat je je gegevensset hebt gekozen, is het tijd om deze te laden met de datasets-bibliotheek!
In dit geval laad je de "validation"-split van de gegevensset "TIGER-Lab/MMLU-Pro", een benchmark-gegevensset voor evaluatie.
De module load_dataset uit het pakket datasets is al voor je ingeladen.
Deze oefening maakt deel uit van de cursus
Werken met Hugging Face
Oefeninstructies
- Gebruik de juiste functie om de gegevensset
"TIGER-Lab/MMLU-Pro"te laden en geef de"validation"-split op.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the "validation" split of the TIGER-Lab/MMLU-Pro dataset
my_dataset = ____("____", split="____")
# Display dataset details
print(my_dataset)