CommencerCommencer gratuitement

Enregistrer des jeux de données prétraités

Dans le cadre de votre projet de chatbot pour le service client, vous avez désormais préparé un jeu de données pour l’affinage d’un modèle Llama. L’étape suivante consiste à enregistrer ce jeu de données afin de pouvoir le recharger plus tard sans avoir à répéter le prétraitement. Cela permettra à votre équipe de réutiliser le jeu de données pour plusieurs expériences et itérations.

Cet exercice fait partie du cours

Ajustement fin avec Llama 3

Afficher le cours

Instructions

  • Enregistrez le jeu de données prétraité ds sur le disque.
  • Chargez le jeu de données enregistré dans une nouvelle variable ds_preprocessed.
  • Affichez le premier élément de ds_preprocessed.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

from datasets import load_from_disk

# Save the dataset to disk
____

# Load the dataset from disk
ds_preprocessed = ____

# Print the first element of the loaded dataset
print(____)
Modifier et exécuter le code