Progettare una pipeline DVC
Progettare una pipeline DVC, o DAG, è fondamentale per sfruttare DVC nei tuoi workflow di Machine Learning. I DAG ci permettono di codificare input, output ed esecuzione di un determinato passo. Gli output di un passo possono diventare input di uno o più passi, impostando in modo naturale le giuste dipendenze tra i vari step.
In questo esercizio, lavorerai alla progettazione di un workflow ML che contiene quattro stage, ovvero:
- Preprocessing dei dati (
preprocess_stage) - Suddivisione dei dati (
split_stage) - Addestramento del modello (
train_stage) - Valutazione del modello (
evaluate_stage)
Useremo esclusivamente i comandi dvc stage add. Scorri fino alla fine del file di shell script (dvc_dag_stages_add.sh) se necessario.
Questo esercizio fa parte del corso
Introduzione al versionamento dei dati con DVC
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio