Eliminar filas
Cuando sabes que una columna concreta será clave para tu análisis, y solo una pequeña fracción de filas no tiene valor en esa columna, suele tener sentido retirar esas filas del conjunto de datos.
Durante este curso, la columna driver_gender será esencial para muchos de tus análisis. Dado que solo una pequeña fracción de filas carece de driver_gender, eliminaremos esas filas del conjunto de datos.
Este ejercicio forma parte del curso
Análisis de la actividad policial con pandas
Instrucciones del ejercicio
- Cuenta el número de valores ausentes en cada columna.
- Elimina todas las filas a las que les falte
driver_genderpasando el nombre de la columna al parámetrosubsetde.dropna(). - Vuelve a contar el número de valores ausentes en cada columna para comprobar que ninguna de las filas restantes carece de
driver_gender. - Examina el
.shapedel DataFrame para ver cuántas filas y columnas quedan.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Count the number of missing values in each column
print(ri.isnull().____)
# Drop all rows that are missing 'driver_gender'
ri.____(subset=[____], inplace=True)
# Count the number of missing values in each column (again)
print(ri.____.____)
# Examine the shape of the DataFrame
print(____)