Reasignación de categorías
Para comprender mejor a los encuestados de airlines, quieres averiguar si existe una relación entre determinadas respuestas y el día de la semana y el tiempo de espera en la puerta.
El DataFrame airlines contiene las columnas day y wait_min, que son categóricas y numéricas respectivamente. La columna day contiene el día exacto en que tuvo lugar un vuelo, y wait_min contiene la cantidad de minutos que tardaron los viajeros en esperar en la puerta de embarque. Para facilitar tu análisis, quieres crear dos nuevas variables categóricas:
wait_type:'short'para 0-60 min,'medium'para 60-180 ylongpara más de 180day_week:'weekday'si el día es entre semana,'weekend'si el día es fin de semana.
Los paquetes pandas y numpy se han importado como pd y np. ¡Vamos a crear nuevos datos categóricos!
Este ejercicio forma parte del curso
Limpieza de datos en Python
Instrucciones del ejercicio
- Crea los rangos y etiquetas para la columna
wait_typemencionada en la descripción. - Crea la columna
wait_typea partir dewait_minutilizandopd.cut(), mientras introduceslabel_rangesylabel_namesen los argumentos correctos. - Crea el diccionario
mappingasignando los días de la semana a'weekday'y los días del fin de semana a'weekend'. - Crea la columna
day_weekutilizando.replace().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create ranges for categories
label_ranges = [0, 60, ____, np.inf]
label_names = ['short', ____, ____]
# Create wait_type column
airlines['wait_type'] = pd.____(____, bins = ____,
labels = ____)
# Create mappings and replace
mappings = {'Monday':'weekday', 'Tuesday':'____', 'Wednesday': '____',
'Thursday': '____', '____': '____',
'Saturday': 'weekend', '____': '____'}
airlines['day_week'] = airlines['day'].____(mappings)