Encontrar valores atípicos mediante IQR
Los valores atípicos pueden tener grandes efectos en estadísticas como la media, así como en estadísticas que se basan en la media, como la varianza y la desviación típica. El rango intercuartílico, o IQR, es otra forma de medir la dispersión que está menos influida por los valores atípicos. El IQR también se utiliza a menudo para encontrar valores atípicos. Si un valor es menor que \(\text{Q1} - 1.5 \times \text{IQR}\) o mayor que \(\text{Q3} + 1.5 \times \text{IQR}\), se considera un valor atípico. De hecho, así es como se calculan las longitudes de los bigotes en un diagrama de caja matplotlib
.
En este ejercicio, calcularás el IQR y lo utilizarás para encontrar algunos valores atípicos. Se ha cargado pandas
como pd
y numpy
como np
, y tienes food_consumption
disponible.
Este ejercicio forma parte del curso
Introducción a la estadística en Python
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Calculate total co2_emission per country: emissions_by_country
emissions_by_country = ____
print(emissions_by_country)