Adição de gráficos ao dvc.yaml
Neste exercício, você tem a tarefa de preencher o arquivo dvc.yaml
que descreve um processo de treinamento de modelo.
Os arquivos preprocess_dataset.py
e train_and_evaluate.py
são responsáveis pelo pré-processamento de dados e pelo treinamento/avaliação do modelo, respectivamente, usando weather.csv
da pasta raw_dataset
como entrada. A saída do código de treinamento do modelo é o arquivo predictions.csv
, que inclui as previsões e os valores reais do conjunto de dados de teste, e um arquivo metrics.json
que contém dados de métricas estruturadas. O arquivo predictions.csv
será utilizado para criar um gráfico de matriz de confusão.
Este exercício faz parte do curso
Introdução ao controle de versão de dados com DVC
Instruções de exercício
- Defina o destino do gráfico como o arquivo de saída que contém os dados de previsão.
- Defina o modelo de plotagem como
confusion
para plotar a matriz de confusão. - Defina o valor correto para a chave
cache
para que você rastreie os programas no repositório Git em vez de DVC remoto. - Execute o pipeline e, em seguida, execute
dvc plots show
. Isso deve gerar um arquivodvc_plots/index.html
.
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
