Creación de gráficos de caja
Los gráficos de caja proporcionan información adicional sobre la distribución de los datos que representan. Nos dicen cuál es la mediana de la distribución, cuál es el rango intercuartílico y también cuál debería ser el rango esperado de aproximadamente el 99 % de los datos. Los valores atípicos más allá de este intervalo se destacan especialmente.
En este ejercicio, utilizarás los datos sobre las alturas de los medallistas que previamente has visualizado como histogramas y como gráficos de barras con barras de error, y los visualizarás como boxplots.
De nuevo, tendrás a tu disposición los DataFrames mens_rowing
y mens_gymnastics
, y ambos tienen columnas llamadas "Height"
que compararás.
Este ejercicio forma parte del curso
Introducción a la visualización de datos con Matplotlib
Instrucciones de ejercicio
- Crea un boxplot que contenga la columna
"Height"
paramens_rowing
a la izquierda ymens_gymnastics
a la derecha. - Añade etiquetas de marca en el eje x:
"Rowing"
y"Gymnastics"
. - Añade una etiqueta al eje y:
"Height (cm)"
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
fig, ax = plt.subplots()
# Add a boxplot for the "Height" column in the DataFrames
____
# Add x-axis tick labels:
____
# Add a y-axis label
____
plt.show()