Recherche de valeurs aberrantes à l’aide de l’IQR
Les valeurs aberrantes peuvent avoir des effets importants sur les statistiques telles que la moyenne, ainsi que sur les statistiques qui reposent sur la moyenne, telles que la variance et l’écart-type. L’écart interquartile, ou IQR, est une autre façon de mesurer la dispersion qui est moins influencée par les valeurs aberrantes. L’IQR est également souvent utilisé pour repérer les valeurs aberrantes. Si une valeur est inférieure à \(\text{Q1} - 1.5 \times \text{IQR}\) ou supérieure à \(text{Q3} + 1.5 \times \text{IQR}\), elle est considérée comme une valeur aberrante. En fait, c’est ainsi que sont calculées les longueurs des moustaches dans un diagramme en boîte matplotlib.

Dans cet exercice, vous calculerez l’IQR et l’utiliserez pour trouver des valeurs aberrantes. pandas est chargé en tant que pd et numpy en tant que np, et food_consumption est disponible.
Cet exercice fait partie du cours
Introduction aux statistiques en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate total co2_emission per country: emissions_by_country
emissions_by_country = ____
print(emissions_by_country)