Adição de gráficos ao dvc.yaml
Neste exercício, você tem a tarefa de preencher o arquivo dvc.yaml que descreve um processo de treinamento de modelo.
Os arquivos preprocess_dataset.py e train_and_evaluate.py são responsáveis pelo pré-processamento de dados e pelo treinamento/avaliação do modelo, respectivamente, usando weather.csv da pasta raw_dataset como entrada. A saída do código de treinamento do modelo é o arquivo predictions.csv, que inclui as previsões e os valores reais do conjunto de dados de teste, e um arquivo metrics.json que contém dados de métricas estruturadas. O arquivo predictions.csv será utilizado para criar um gráfico de matriz de confusão.
Este exercício faz parte do curso
Introdução ao controle de versão de dados com DVC
Instruções do exercício
- Defina o destino do gráfico como o arquivo de saída que contém os dados de previsão.
- Defina o modelo de plotagem como
confusionpara plotar a matriz de confusão. - Defina o valor correto para a chave
cachepara que você rastreie os programas no repositório Git em vez de DVC remoto. - Execute o pipeline e, em seguida, execute
dvc plots show. Isso deve gerar um arquivodvc_plots/index.html.
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício