ComenzarEmpieza gratis

Resaltar valores en la distribución

A veces es necesario manipular tus datos para crear una visualización mejor. Dos métodos que pueden gestionar los valores ausentes son .dropna() y .fillna(). También puedes eliminar valores atípicos filtrando las entradas que estén por encima o por debajo de cierto percentil aplicando una condición con .quantile() a una columna concreta.

En el vídeo también viste cómo resaltar un valor concreto en una gráfica añadiendo una línea vertical en la posición x a lo largo de los ejes:

Axes.axvline(x=0, color=None, ...)

En este ejercicio, darás un último vistazo a la distribución de ingresos global, luego eliminarás los valores atípicos por encima del percentil 95, representarás la distribución y resaltarás tanto la media como la mediana. pandas como pd, seaborn como sns y matplotlib.pyplot como plt ya se han importado, y el DataFrame income de ejercicios anteriores está disponible en tu espacio de trabajo.

Este ejercicio forma parte del curso

Importación y gestión de datos financieros en Python

Ver curso

Instrucciones del ejercicio

  • Asigna la columna 'Income per Capita' a inc_per_capita.
  • Filtra para quedarte solo con las filas de inc_per_capita que están por debajo del percentil 95. Reasigna a la misma variable.
  • Dibuja un histograma por defecto para la versión filtrada de inc_per_capita y asígnalo a ax.
  • Usa ax.axvline() con color='b' para resaltar la media de inc_per_capita en azul,
  • Usa ax.axvline() con color='g' para resaltar la mediana en verde. ¡Muestra el resultado!

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create inc_per_capita
inc_per_capita = ____

# Filter out incomes above the 95th percentile
inc_per_capita = inc_per_capita[____ < ____]

# Plot histogram and assign to ax
ax = ____

# Highlight mean
ax.axvline(inc_per_capita.mean(), color='b')

# Highlight median
ax.axvline(inc_per_capita.median(), color='g')

# Show the plot
plt.show()
Editar y ejecutar código