ComenzarEmpieza gratis

Eliminar filas

Cuando sabes que una columna concreta será clave para tu análisis, y solo una pequeña fracción de filas no tiene valor en esa columna, suele tener sentido retirar esas filas del conjunto de datos.

Durante este curso, la columna driver_gender será esencial para muchos de tus análisis. Dado que solo una pequeña fracción de filas carece de driver_gender, eliminaremos esas filas del conjunto de datos.

Este ejercicio forma parte del curso

Análisis de la actividad policial con pandas

Ver curso

Instrucciones del ejercicio

  • Cuenta el número de valores ausentes en cada columna.
  • Elimina todas las filas a las que les falte driver_gender pasando el nombre de la columna al parámetro subset de .dropna().
  • Vuelve a contar el número de valores ausentes en cada columna para comprobar que ninguna de las filas restantes carece de driver_gender.
  • Examina el .shape del DataFrame para ver cuántas filas y columnas quedan.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Count the number of missing values in each column
print(ri.isnull().____)

# Drop all rows that are missing 'driver_gender'
ri.____(subset=[____], inplace=True)

# Count the number of missing values in each column (again)
print(ri.____.____)

# Examine the shape of the DataFrame
print(____)
Editar y ejecutar código