ComenzarEmpieza gratis

Guardar conjuntos de datos preprocesados

Como parte de tu proyecto de chatbot de atención al cliente, ya has preparado un conjunto de datos para ajustar finamente un modelo Llama. El siguiente paso es guardar el conjunto de datos para poder cargarlo más adelante sin tener que repetir el preprocesamiento. Esto permitirá que tu equipo lo reutilice en múltiples experimentos e iteraciones.

Este ejercicio forma parte del curso

Ajuste fino con Llama 3

Ver curso

Instrucciones del ejercicio

  • Guarda en disco el conjunto de datos preprocesado ds.
  • Carga el conjunto de datos guardado en una nueva variable ds_preprocessed.
  • Imprime el primer elemento de ds_preprocessed.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

from datasets import load_from_disk

# Save the dataset to disk
____

# Load the dataset from disk
ds_preprocessed = ____

# Print the first element of the loaded dataset
print(____)
Editar y ejecutar código