Voorbewerkte gegevenssets opslaan
Als onderdeel van je klantenservice-chatbotproject heb je nu een gegevensset voorbereid voor fine-tuning van een Llama-model. De volgende stap is om de gegevensset op te slaan, zodat je die later kunt herladen zonder de stappen voor voorbewerking te herhalen. Zo kan je team de gegevensset hergebruiken in meerdere experimenten en iteraties.
Deze oefening maakt deel uit van de cursus
Fijn-afstemmen met Llama 3
Oefeninstructies
- Sla de voorbewerkte gegevensset
dsop naar schijf. - Laad de opgeslagen gegevensset in een nieuwe variabele
ds_preprocessed. - Print het eerste element van
ds_preprocessed.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
from datasets import load_from_disk
# Save the dataset to disk
____
# Load the dataset from disk
ds_preprocessed = ____
# Print the first element of the loaded dataset
print(____)