ComenzarEmpieza gratis

Comprobaciones de calidad de datos

Como aprendiste en el vídeo anterior, los valores ausentes pueden suponer una pérdida de información valiosa y llevar a interpretaciones incorrectas. Del mismo modo, la presencia de valores no vistos también puede afectar a la confianza de tu modelo.

En este ejercicio, tu objetivo es comprobar si el conjunto de datos de reservas de hotel contiene valores ausentes e identificar posibles valores no vistos. Los conjuntos de datos de referencia y de análisis ya están cargados, al igual que la biblioteca nannyml.

Un recordatorio rápido: si no recuerdas los tipos de columna, puedes explorar los datos fácilmente con el método .head().

Este ejercicio forma parte del curso

Monitorización de Machine Learning en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Define analyzed columns
selected_columns = ['country', 'lead_time', 'parking_spaces', 'hotel']

# Intialize missing values calculator
ms_calc = ____.____(
    ____=____,
    ____=____,
    timestamp_column_name='timestamp'
)

# Fit, calculate and plot the results
ms_calc.fit(reference)
ms_results = ms_calc.calculate(analysis)
ms_results.plot().show()
Editar y ejecutar código