Metriken und Plots zu dvc.yaml hinzufügen
In dieser Übung sollst du den Inhalt von dvc.yaml vervollständigen, der einen Workflow zum Trainieren eines Modells definiert.
Hier führen preprocess_dataset.py und train.py die Datenvorverarbeitung und das Modelltraining aus. Beide nehmen weather.csv aus dem Ordner raw_dataset als Eingabe. Als Ausgabe erzeugt der Training-Code eine Datei predictions.csv mit den Vorhersagen und den Ground-Truth-Werten sowie eine metrics.json mit strukturierten Metrikdaten. Erstere wird verwendet, um einen normalisierten Plot der Konfusionsmatrix zu erstellen und ihn mit früheren Commits zu vergleichen.
Diese Übung ist Teil des Kurses
CI/CD für Machine Learning
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten