Limpieza de tu conjunto de datos
Los conjuntos de datos reales, como el de enfermedades cardiacas, suelen estar desordenados y contener valores duplicados o ausentes. En este ejercicio, aplicarás lo aprendido en este capítulo para limpiar el conjunto de datos de enfermedades cardiacas. Ya tienes el conjunto cargado. Tu tarea es identificar y ejecutar operaciones de limpieza generales basadas en los resultados del EDA: eliminar columnas vacías, borrar filas duplicadas y realizar imputación en la columna restecg, que corresponde a una medida de electrocardiograma. Pandas se ha importado como pd, y el conjunto de datos se encuentra en un DataFrame de pandas llamado heart_disease_df.
Este ejercicio forma parte del curso
Machine Learning de extremo a extremo
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Drop empty columns
heart_disease_column_dropped = heart_disease_df.____(____, ____)