ComeçarComece de graça

Projetando um pipeline em DVC

Projetar um pipeline em DVC, ou DAG, é fundamental para aproveitar o DVC nos seus fluxos de trabalho de Machine Learning. DAGs nos permitem codificar entradas, saídas e a execução de uma determinada etapa. As saídas de uma etapa podem servir de entrada para uma ou mais etapas, estabelecendo naturalmente as dependências corretas entre elas.

Neste exercício, você vai projetar um fluxo de trabalho de ML com quatro estágios:

  • Pré-processamento de dados (preprocess_stage)
  • Divisão dos dados (split_stage)
  • Treinamento do modelo (train_stage)
  • Avaliação do modelo (evaluate_stage)

Vamos trabalhar exclusivamente com os comandos dvc stage add. Role até o final do arquivo de shell script (dvc_dag_stages_add.sh) se necessário.

Este exercício faz parte do curso

Introdução ao Controle de Versão de Dados com DVC

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício