1. Apprendre
  2. /
  3. Cours
  4. /
  5. Introduction à la statistique en Python

Connected

Exercice

Détection des valeurs aberrantes avec l'IQR

Les valeurs aberrantes peuvent avoir de grands effets sur des statistiques comme la moyenne, ainsi que sur celles qui en dépendent, comme la variance et l'écart-type. L'intervalle interquartile (IQR) est une autre mesure de dispersion, moins influencée par les valeurs aberrantes. On l'utilise souvent pour les repérer. Si une valeur est inférieure à \(\text{Q1} - 1.5 \times \text{IQR}\) ou supérieure à \(\text{Q3} + 1.5 \times \text{IQR}\), on la considère comme une valeur aberrante. C'est d'ailleurs ainsi qu'on calcule la longueur des moustaches dans un diagramme à moustaches matplotlib.

Diagram of a box plot showing median, quartiles, and outliers

Dans cet exercice, vous allez calculer l'IQR et l'utiliser pour trouver des valeurs aberrantes. pandas sous pd et numpy sous np sont chargés et food_consumption est disponible.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • Calculez le co2_emission total par pays en groupant par pays et en faisant la somme de co2_emission. Enregistrez le DataFrame résultant dans emissions_by_country.