ComeçarComece gratuitamente

Adição de gráficos ao dvc.yaml

Neste exercício, você tem a tarefa de preencher o arquivo dvc.yaml que descreve um processo de treinamento de modelo.

Os arquivos preprocess_dataset.py e train_and_evaluate.py são responsáveis pelo pré-processamento de dados e pelo treinamento/avaliação do modelo, respectivamente, usando weather.csv da pasta raw_dataset como entrada. A saída do código de treinamento do modelo é o arquivo predictions.csv, que inclui as previsões e os valores reais do conjunto de dados de teste, e um arquivo metrics.json que contém dados de métricas estruturadas. O arquivo predictions.csv será utilizado para criar um gráfico de matriz de confusão.

Este exercício faz parte do curso

Introdução ao controle de versão de dados com DVC

Ver Curso

Instruções de exercício

  • Defina o destino do gráfico como o arquivo de saída que contém os dados de previsão.
  • Defina o modelo de plotagem como confusion para plotar a matriz de confusão.
  • Defina o valor correto para a chave cache para que você rastreie os programas no repositório Git em vez de DVC remoto.
  • Execute o pipeline e, em seguida, execute dvc plots show. Isso deve gerar um arquivo dvc_plots/index.html.

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Comece o exercício