Enregistrer des jeux de données prétraités
Dans le cadre de votre projet de chatbot pour le service client, vous avez désormais préparé un jeu de données pour l’affinage d’un modèle Llama. L’étape suivante consiste à enregistrer ce jeu de données afin de pouvoir le recharger plus tard sans avoir à répéter le prétraitement. Cela permettra à votre équipe de réutiliser le jeu de données pour plusieurs expériences et itérations.
Cet exercice fait partie du cours
Ajustement fin avec Llama 3
Instructions
- Enregistrez le jeu de données prétraité
dssur le disque. - Chargez le jeu de données enregistré dans une nouvelle variable
ds_preprocessed. - Affichez le premier élément de
ds_preprocessed.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
from datasets import load_from_disk
# Save the dataset to disk
____
# Load the dataset from disk
ds_preprocessed = ____
# Print the first element of the loaded dataset
print(____)