ComenzarEmpieza gratis

Reasignación de categorías

Para comprender mejor a los encuestados de airlines, quieres averiguar si existe una relación entre determinadas respuestas y el día de la semana y el tiempo de espera en la puerta.

El DataFrame airlines contiene las columnas day y wait_min, que son categóricas y numéricas respectivamente. La columna day contiene el día exacto en que tuvo lugar un vuelo, y wait_min contiene la cantidad de minutos que tardaron los viajeros en esperar en la puerta de embarque. Para facilitar tu análisis, quieres crear dos nuevas variables categóricas:

  • wait_type: 'short' para 0-60 min, 'medium' para 60-180 y long para más de 180
  • day_week: 'weekday' si el día es entre semana, 'weekend' si el día es fin de semana.

Los paquetes pandas y numpy se han importado como pd y np. ¡Vamos a crear nuevos datos categóricos!

Este ejercicio forma parte del curso

Limpieza de datos en Python

Ver curso

Instrucciones de ejercicio

  • Crea los rangos y etiquetas para la columna wait_type mencionada en la descripción.
  • Crea la columna wait_type a partir de wait_min utilizando pd.cut(), mientras introduces label_ranges y label_names en los argumentos correctos.
  • Crea el diccionario mapping asignando los días de la semana a 'weekday' y los días del fin de semana a 'weekend'.
  • Crea la columna day_week utilizando .replace().

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Create ranges for categories
label_ranges = [0, 60, ____, np.inf]
label_names = ['short', ____, ____]

# Create wait_type column
airlines['wait_type'] = pd.____(____, bins = ____, 
                                labels = ____)

# Create mappings and replace
mappings = {'Monday':'weekday', 'Tuesday':'____', 'Wednesday': '____', 
            'Thursday': '____', '____': '____', 
            'Saturday': 'weekend', '____': '____'}

airlines['day_week'] = airlines['day'].____(mappings)
Editar y ejecutar código