Salvataggio degli insiemi di dati preelaborati
Nel tuo progetto di chatbot per l'assistenza clienti, hai preparato un insieme di dati per il fine-tuning di un modello Llama. Il prossimo passo è salvare l'insieme di dati, così potrai ricaricarlo in seguito senza dover ripetere la fase di pre-elaborazione. Questo permetterà al tuo team di riutilizzarlo in più esperimenti e iterazioni.
Questo esercizio fa parte del corso
Fine-tuning con Llama 3
Istruzioni dell'esercizio
- Salva su disco l'insieme di dati preelaborato
ds. - Carica l'insieme di dati salvato in una nuova variabile
ds_preprocessed. - Stampa il primo elemento di
ds_preprocessed.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
from datasets import load_from_disk
# Save the dataset to disk
____
# Load the dataset from disk
ds_preprocessed = ____
# Print the first element of the loaded dataset
print(____)