Reasignación de categorías
Para comprender mejor a los encuestados de airlines
, quieres averiguar si existe una relación entre determinadas respuestas y el día de la semana y el tiempo de espera en la puerta.
El DataFrame airlines
contiene las columnas day
y wait_min
, que son categóricas y numéricas respectivamente. La columna day
contiene el día exacto en que tuvo lugar un vuelo, y wait_min
contiene la cantidad de minutos que tardaron los viajeros en esperar en la puerta de embarque. Para facilitar tu análisis, quieres crear dos nuevas variables categóricas:
wait_type
:'short'
para 0-60 min,'medium'
para 60-180 ylong
para más de 180day_week
:'weekday'
si el día es entre semana,'weekend'
si el día es fin de semana.
Los paquetes pandas
y numpy
se han importado como pd
y np
. ¡Vamos a crear nuevos datos categóricos!
Este ejercicio forma parte del curso
Limpieza de datos en Python
Instrucciones de ejercicio
- Crea los rangos y etiquetas para la columna
wait_type
mencionada en la descripción. - Crea la columna
wait_type
a partir dewait_min
utilizandopd.cut()
, mientras introduceslabel_ranges
ylabel_names
en los argumentos correctos. - Crea el diccionario
mapping
asignando los días de la semana a'weekday'
y los días del fin de semana a'weekend'
. - Crea la columna
day_week
utilizando.replace()
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create ranges for categories
label_ranges = [0, 60, ____, np.inf]
label_names = ['short', ____, ____]
# Create wait_type column
airlines['wait_type'] = pd.____(____, bins = ____,
labels = ____)
# Create mappings and replace
mappings = {'Monday':'weekday', 'Tuesday':'____', 'Wednesday': '____',
'Thursday': '____', '____': '____',
'Saturday': 'weekend', '____': '____'}
airlines['day_week'] = airlines['day'].____(mappings)