Eliminar los datos que faltan
Ahora que has explorado el conjunto de datos volunteer y conoces su estructura y contenido, es hora de empezar a eliminar los valores perdidos.
En este ejercicio, eliminarás tanto columnas como filas para crear un subconjunto del conjunto de datos volunteer.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones del ejercicio
- Elimina las columnas
LatitudeyLongitudede la tablavolunteer, y guarda comovolunteer_cols. - Subconjunta
volunteer_colseliminando las filas que contienen valores perdidos encategory_desc, y almacénalas en una nueva variable llamadavolunteer_subset. - Echa un vistazo al atributo
.shapedevolunteer_subset, para comprobar que ha funcionado correctamente.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Drop the Latitude and Longitude columns from volunteer
volunteer_cols = ____
# Drop rows with missing category_desc values from volunteer_cols
volunteer_subset = ____
# Print out the shape of the subset
print(____.____)