Trabajar con DVC Caché
En este ejercicio, explorarás cómo añadir y eliminar datos de la caché DVC.
Estás trabajando en un proyecto de aprendizaje automático que implica un conjunto de datos meteorológicos, prediciendo si llovería dadas las condiciones atmosféricas. A medida que actualices el conjunto de datos, querrás asegurarte de que se realiza un seguimiento de los cambios y de que puedes volver fácilmente a versiones anteriores si es necesario.
Git y DVC ya están inicializados en el espacio de trabajo.
Este ejercicio forma parte del curso
Introducción al control de versiones de datos con DVC
Instrucciones de ejercicio
- Añade
dataset.csv
a DVC y examina el contenido dedataset.csv.dvc
abriéndolo en el editor de archivos. - Comprueba que la caché DVC está llena ejecutando el comando
find .dvc/cache -type f
en el terminal. Abre el archivodataset.csv.dvc
y compara la salida de este comando con el campomd5
. - Desinstala el archivo de metadatos DVC y borra la caché del espacio de trabajo ejecutando los comandos adecuados en el terminal.
- Comprueba que la caché de DVC está ahora vacía ejecutando el comando
find .dvc/cache -type f
en el terminal.
Ejercicio interactivo práctico
Convierte la teoría en acción con uno de nuestros ejercicios interactivos
