Configurer l’entraînement du modèle avec CML
Dans cet exercice, vous allez utiliser l’action GitHub CML pour entraîner un Random Forest Classifier afin de prédire les précipitations. CML est une action GitHub qui simplifie la génération de rapports pour les expériences de ML.
L’entraînement se déclenchera lorsque vous ouvrirez une PR sur la branche main.
Vous continuerez à travailler avec le jeu de données météo ; le fichier preprocess_dataset.py contient des fonctions utilitaires pour prétraiter le jeu de données comme précédemment.
L’exécution de train.py produit un fichier metrics.json contenant les métriques du modèle, ainsi qu’un fichier confusion_matrix.png contenant le tracé de la matrice de confusion.
Votre tâche consiste à terminer l’ébauche de .github/workflows/train_cml.yaml pour définir un flux d’entraînement de modèle de haut niveau.
REMARQUE : utilisez python3 au lieu de python pour lancer les scripts Python.
Cet exercice fait partie du cours
CI/CD pour le Machine Learning
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice