Aan de slagGa gratis aan de slag

Voorbewerkte gegevenssets opslaan

Als onderdeel van je klantenservice-chatbotproject heb je nu een gegevensset voorbereid voor fine-tuning van een Llama-model. De volgende stap is om de gegevensset op te slaan, zodat je die later kunt herladen zonder de stappen voor voorbewerking te herhalen. Zo kan je team de gegevensset hergebruiken in meerdere experimenten en iteraties.

Deze oefening maakt deel uit van de cursus

Fijn-afstemmen met Llama 3

Cursus bekijken

Oefeninstructies

  • Sla de voorbewerkte gegevensset ds op naar schijf.
  • Laad de opgeslagen gegevensset in een nieuwe variabele ds_preprocessed.
  • Print het eerste element van ds_preprocessed.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

from datasets import load_from_disk

# Save the dataset to disk
____

# Load the dataset from disk
ds_preprocessed = ____

# Print the first element of the loaded dataset
print(____)
Code bewerken en uitvoeren