Guardar conjuntos de datos preprocesados
Como parte de tu proyecto de chatbot de atención al cliente, ya has preparado un conjunto de datos para ajustar finamente un modelo Llama. El siguiente paso es guardar el conjunto de datos para poder cargarlo más adelante sin tener que repetir el preprocesamiento. Esto permitirá que tu equipo lo reutilice en múltiples experimentos e iteraciones.
Este ejercicio forma parte del curso
Ajuste fino con Llama 3
Instrucciones del ejercicio
- Guarda en disco el conjunto de datos preprocesado
ds. - Carga el conjunto de datos guardado en una nueva variable
ds_preprocessed. - Imprime el primer elemento de
ds_preprocessed.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
from datasets import load_from_disk
# Save the dataset to disk
____
# Load the dataset from disk
ds_preprocessed = ____
# Print the first element of the loaded dataset
print(____)