Configurar o treino de modelo usando CML
Neste exercício, você vai usar a CML GitHub Action para treinar um Random Forest Classifier que prevê precipitação. CML é uma GitHub Action que simplifica a geração de relatórios para experimentos de ML.
O treinamento será acionado quando você abrir um PR contra a branch main.
Você continuará trabalhando com o conjunto de dados de clima; o arquivo preprocess_dataset.py contém funções auxiliares para pré-processar o conjunto de dados como antes.
A saída ao executar train.py é um arquivo metrics.json com as métricas do modelo e um arquivo confusion_matrix.png com o gráfico da matriz de confusão.
Sua tarefa é finalizar o esqueleto de .github/workflows/train_cml.yaml para definir um fluxo de treino de modelo em alto nível.
OBSERVAÇÃO: Use python3 em vez de python para executar scripts Python.
Este exercício faz parte do curso
CI/CD para Machine Learning
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício