Eliminar los datos que faltan
Ahora que has explorado el conjunto de datos volunteer
y conoces su estructura y contenido, es hora de empezar a eliminar los valores perdidos.
En este ejercicio, eliminarás tanto columnas como filas para crear un subconjunto del conjunto de datos volunteer
.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Elimina las columnas
Latitude
yLongitude
de la tablavolunteer
, y guarda comovolunteer_cols
. - Subconjunta
volunteer_cols
eliminando las filas que contienen valores perdidos encategory_desc
, y almacénalas en una nueva variable llamadavolunteer_subset
. - Echa un vistazo al atributo
.shape
devolunteer_subset
, para comprobar que ha funcionado correctamente.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Drop the Latitude and Longitude columns from volunteer
volunteer_cols = ____
# Drop rows with missing category_desc values from volunteer_cols
volunteer_subset = ____
# Print out the shape of the subset
print(____.____)