Modelltraining mit CML einrichten
In dieser Übung verwendest du die CML GitHub Action, um einen Random-Forest-Klassifikator zu trainieren, der Niederschlag vorhersagt. CML ist eine GitHub Action, die das Erstellen von Berichten für ML-Experimente vereinfacht.
Das Training wird ausgelöst, wenn du einen PR gegen den Branch main öffnest.
Du arbeitest weiterhin mit dem Wetterdatensatz; die Datei preprocess_dataset.py enthält Hilfsfunktionen zur Vorverarbeitung des Datensatzes wie zuvor.
Die Ausgabe von train.py ist eine Datei metrics.json mit Modellmetriken und eine Datei confusion_matrix.png mit der Visualisierung der Konfusionsmatrix.
Deine Aufgabe ist es, die vorbereitete Datei .github/workflows/train_cml.yaml zu vervollständigen, um einen groben Ablauf für das Modelltraining zu formulieren.
HINWEIS: Verwende python3 statt python, um Python-Skripte auszuführen.
Diese Übung ist Teil des Kurses
CI/CD für Machine Learning
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten