Trabalhando com o DVC Cache
Neste exercício, você explorará como adicionar e remover dados do cache DVC.
Você está trabalhando em um projeto de machine learning que envolve um conjunto de dados meteorológicos, prevendo se choveria em função das condições atmosféricas. Ao fazer atualizações no conjunto de dados, você quer garantir que as alterações sejam programadas e que você possa reverter facilmente para versões anteriores, se necessário.
O Git e o DVC já estão inicializados no espaço de trabalho.
Este exercício faz parte do curso
Introdução ao controle de versão de dados com DVC
Instruções do exercício
- Adicione
dataset.csv
a DVC e examine o conteúdo dedataset.csv.dvc
abrindo-o no editor de arquivos. - Verifique se o cache DVC está preenchido executando o comando
find .dvc/cache -type f
no terminal. Abra o arquivodataset.csv.dvc
e compare a saída desse comando com o campomd5
. - Remova o arquivo de metadados DVC e limpe o cache do espaço de trabalho executando os comandos apropriados no terminal.
- Verifique se o cache do DVC está vazio executando o comando
find .dvc/cache -type f
no terminal.
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
