ComenzarEmpieza gratis

Limpieza de tu conjunto de datos

Los conjuntos de datos reales, como el de enfermedades cardiacas, suelen estar desordenados y contener valores duplicados o ausentes. En este ejercicio, aplicarás lo aprendido en este capítulo para limpiar el conjunto de datos de enfermedades cardiacas. Ya tienes el conjunto cargado. Tu tarea es identificar y ejecutar operaciones de limpieza generales basadas en los resultados del EDA: eliminar columnas vacías, borrar filas duplicadas y realizar imputación en la columna restecg, que corresponde a una medida de electrocardiograma. Pandas se ha importado como pd, y el conjunto de datos se encuentra en un DataFrame de pandas llamado heart_disease_df.

Este ejercicio forma parte del curso

Machine Learning de extremo a extremo

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Drop empty columns
heart_disease_column_dropped = heart_disease_df.____(____, ____)
Editar y ejecutar código