Añadir parcelas a dvc.yaml
En este ejercicio, se te pide que completes el archivo dvc.yaml
que describe el proceso de entrenamiento de un modelo.
Los archivos preprocess_dataset.py
y train_and_evaluate.py
se encargan del preprocesamiento de los datos y del entrenamiento/evaluación del modelo, respectivamente, utilizando como entrada weather.csv
de la carpeta raw_dataset
. La salida del código de entrenamiento del modelo es el archivo predictions.csv
, que incluye las predicciones y los valores reales del conjunto de datos de prueba, y un archivo metrics.json
que contiene datos métricos estructurados. El archivo predictions.csv
se utilizará para crear un gráfico de matriz de confusión.
Este ejercicio forma parte del curso
Introducción al control de versiones de datos con DVC
Instrucciones de ejercicio
- Establece como destino del trazado el archivo de salida que contiene los datos de las predicciones.
- Establece la plantilla de trazado en
confusion
para trazar la matriz de confusión. - Establece el valor correcto de la clave
cache
para realizar un seguimiento de las tramas en el repositorio Git en lugar de DVC remoto. - Ejecuta la canalización y luego ejecuta
dvc plots show
. Esto debería generar un archivodvc_plots/index.html
.
Ejercicio interactivo práctico
Convierte la teoría en acción con uno de nuestros ejercicios interactivos
