Execute um pipeline de treinamento do modelo ML
DVC são usados para garantir a reprodutibilidade do seu projeto.
Neste exercício, você aproveitará o que aprendeu com a criação de um pipeline no arquivo dvc.yaml
e executará as etapas para treinar um modelo de machine learning usando uma abordagem estruturada. Sua tarefa é executar diferentes variantes do comando dvc repro
para entender suas nuances.
Este exercício faz parte do curso
Introdução ao controle de versão de dados com DVC
Instruções do exercício
- Execute uma execução seca do pipeline. Entenda as etapas e a ordem de execução.
- Execute somente o estágio de pré-processamento do pipeline especificado no bloco
preprocess
emdvc.yaml
. Observe as alterações no arquivodvc.lock
. - Execute somente o estágio de treinamento/avaliação do pipeline especificado no bloco
train_and_evaluate
emdvc.yaml
. Observe as alterações no arquivodvc.lock
. - Execute todo o pipeline do DVC. Observe como o armazenamento em cache em DVC ignora a execução real das etapas.
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
