CommencerCommencer gratuitement

Recherche de valeurs aberrantes à l’aide de l’IQR

Les valeurs aberrantes peuvent avoir des effets importants sur les statistiques telles que la moyenne, ainsi que sur les statistiques qui reposent sur la moyenne, telles que la variance et l’écart-type. L’écart interquartile, ou IQR, est une autre façon de mesurer la dispersion qui est moins influencée par les valeurs aberrantes. L’IQR est également souvent utilisé pour repérer les valeurs aberrantes. Si une valeur est inférieure à \(\text{Q1} - 1.5 \times \text{IQR}\) ou supérieure à \(text{Q3} + 1.5 \times \text{IQR}\), elle est considérée comme une valeur aberrante. En fait, c’est ainsi que sont calculées les longueurs des moustaches dans un diagramme en boîte matplotlib.

Diagramme en boîte montrant la médiane, les quartiles et les valeurs aberrantes

Dans cet exercice, vous calculerez l’IQR et l’utiliserez pour trouver des valeurs aberrantes. pandas est chargé en tant que pd et numpy en tant que np, et food_consumption est disponible.

Cet exercice fait partie du cours

Introduction aux statistiques en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate total co2_emission per country: emissions_by_country
emissions_by_country = ____

print(emissions_by_country)
Modifier et exécuter le code