1. Learn
  2. /
  3. Kurser
  4. /
  5. Introduktion till statistik i Python

Connected

övning

Hitta extremvärden med IQR

Extremvärden kan ha stor påverkan på statistiska mått som medelvärdet, men även på mått som bygger på medelvärdet, till exempel varians och standardavvikelse. Kvartilavstånd, eller IQR (interquartile range), är ett annat sätt att mäta spridning som är mindre känsligt för extremvärden. IQR används också ofta för att identifiera extremvärden. Om ett värde är mindre än \(\text{Q1} - 1.5 \times \text{IQR}\) eller större än \(\text{Q3} + 1.5 \times \text{IQR}\) betraktas det som ett extremvärde. Det är faktiskt på detta sätt som mustaschernas längd beräknas i ett lådagram i matplotlib.

Diagram of a box plot showing median, quartiles, and outliers

I den här övningen beräknar du IQR och använder det för att hitta några extremvärden. pandas som pd och numpy som np är laddade och food_consumption finns tillgänglig.

Instruktioner 1/4

undefined XP
    1
    2
    3
    4
  • Beräkna den totala co2_emission per land genom att gruppera efter land och summera co2_emission. Spara den resulterande DataFrame:n som emissions_by_country.