ComenzarEmpieza gratis

Visualización de muchas categorías

Hasta ahora, en este capítulo, solo hemos tenido en cuenta el caso de diferencias en una variable numérica entre dos categorías. Por supuesto, muchos conjuntos de datos contienen más categorías. Antes de empezar a hacer pruebas con muchas categorías, suele ser útil realizar un análisis exploratorio de datos (EDA), calculando estadísticas resumidas para cada grupo y visualizando las distribuciones de la variable numérica para cada categoría mediante gráficos de caja.

Aquí, volveremos a los datos de los envíos retrasados y a cómo varía el precio de cada paquete (pack_price) entre los tres modos de envío (shipment_mode): "Air", "Air Charter" y "Ocean".

late_shipments está disponible; pandas y matplotlib.pyplot se cargan con sus alias estándar, y seaborn se carga como sns.

Este ejercicio forma parte del curso

Pruebas de hipótesis en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate the mean pack_price for each shipment_mode
xbar_pack_by_mode = ____

# Print the grouped means
print(xbar_pack_by_mode)
Editar y ejecutar código