ComenzarEmpieza gratis

Identificar valores faltantes

El primer paso antes de imputar valores faltantes es identificar si hay valores faltantes en los datos y, de ser así, de qué grupo provienen.

En el mismo restaurant_data que viste en la lección, un empleado borró por error las propinas dejadas en 65 mesas. La cuestión es cuántas entradas faltantes provienen de mesas en las que había fumadores frente a mesas sin fumadores.

Tu tarea es agrupar ambos conjuntos de datos según la variable smoker, contar el número de valores presentes y luego calcular la diferencia.

Estamos imputando propinas para que practiques los conceptos de la lección. Desde un punto de vista ético, no deberías imputar datos financieros en la vida real, ya que podría considerarse fraude.

Este ejercicio forma parte del curso

Escribir código eficiente con pandas

Ver curso

Instrucciones del ejercicio

  • Agrupa los datos según el estado de fumador.
  • Calcula el número de valores no faltantes en cada grupo.
  • Imprime el número de valores faltantes en cada grupo.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Group both objects according to smoke condition
restaurant_nan_grouped = restaurant_nan.____(____)

# Store the number of present values
restaurant_nan_nval = restaurant_nan_grouped['tip'].____()

# Print the group-wise missing entries
print(restaurant_nan_grouped['total_bill'].count() - ____)
Editar y ejecutar código