IniziaInizia gratis

Progettare una pipeline DVC

Progettare una pipeline DVC, o DAG, è fondamentale per sfruttare DVC nei tuoi workflow di Machine Learning. I DAG ci permettono di codificare input, output ed esecuzione di un determinato passo. Gli output di un passo possono diventare input di uno o più passi, impostando in modo naturale le giuste dipendenze tra i vari step.

In questo esercizio, lavorerai alla progettazione di un workflow ML che contiene quattro stage, ovvero:

  • Preprocessing dei dati (preprocess_stage)
  • Suddivisione dei dati (split_stage)
  • Addestramento del modello (train_stage)
  • Valutazione del modello (evaluate_stage)

Useremo esclusivamente i comandi dvc stage add. Scorri fino alla fine del file di shell script (dvc_dag_stages_add.sh) se necessario.

Questo esercizio fa parte del corso

Introduzione al versionamento dei dati con DVC

Visualizza il corso

Esercizio pratico interattivo

Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi

Inizia esercizio