ComenzarEmpieza gratis

Añadir parcelas a dvc.yaml

En este ejercicio, se te pide que completes el archivo dvc.yaml que describe el proceso de entrenamiento de un modelo.

Los archivos preprocess_dataset.py y train_and_evaluate.py se encargan del preprocesamiento de los datos y del entrenamiento/evaluación del modelo, respectivamente, utilizando como entrada weather.csv de la carpeta raw_dataset. La salida del código de entrenamiento del modelo es el archivo predictions.csv, que incluye las predicciones y los valores reales del conjunto de datos de prueba, y un archivo metrics.json que contiene datos métricos estructurados. El archivo predictions.csv se utilizará para crear un gráfico de matriz de confusión.

Este ejercicio forma parte del curso

Introducción al control de versiones de datos con DVC

Ver curso

Instrucciones de ejercicio

  • Establece como destino del trazado el archivo de salida que contiene los datos de las predicciones.
  • Establece la plantilla de trazado en confusion para trazar la matriz de confusión.
  • Establece el valor correcto de la clave cache para realizar un seguimiento de las tramas en el repositorio Git en lugar de DVC remoto.
  • Ejecuta la canalización y luego ejecuta dvc plots show. Esto debería generar un archivo dvc_plots/index.html.

Ejercicio interactivo práctico

Convierte la teoría en acción con uno de nuestros ejercicios interactivos

Empieza a hacer ejercicio