LoslegenKostenlos loslegen

Eine DVC-Pipeline entwerfen

Das Entwerfen einer DVC-Pipeline, also eines DAG, ist grundlegend, um DVC in deinen Machine-Learning-Workflows zu nutzen. DAGs erlauben es uns, Eingaben, Ausgaben und die Ausführung eines bestimmten Schritts zu kodifizieren. Die Ausgaben eines Schritts können als Eingabe für einen oder mehrere Schritte dienen und setzen so automatisch die richtigen Abhängigkeiten zwischen den Schritten.

In dieser Übung gestaltest du einen ML-Workflow mit vier Stufen:

  • Datenvorverarbeitung (preprocess_stage)
  • Datensplitting (split_stage)
  • Modelltraining (train_stage)
  • Modellevaluierung (evaluate_stage)

Wir arbeiten ausschließlich mit den Befehlen dvc stage add. Scrolle bei Bedarf bis zum Ende der Shell-Skriptdatei (dvc_dag_stages_add.sh).

Diese Übung ist Teil des Kurses

Einführung in Data Versioning mit DVC

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten