1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do statystyki w Pythonie

Connected

ćwiczenie

Wykrywanie wartości odstających za pomocą IQR

Wartości odstające mogą znacząco wpływać na statystyki takie jak średnia, a także na miary oparte na średniej, czyli wariancję i odchylenie standardowe. Rozstęp międzykwartylowy, czyli IQR, to inny sposób mierzenia rozproszenia danych – mniej wrażliwy na wartości odstające. IQR jest też często wykorzystywany do ich wykrywania. Jeśli wartość jest mniejsza niż \(\text{Q1} - 1{,}5 \times \text{IQR}\) lub większa niż \(\text{Q3} + 1{,}5 \times \text{IQR}\), uznaje się ją za wartość odstającą. Właśnie w ten sposób obliczana jest długość wąsów na wykresie pudełkowym w matplotlib.

Diagram of a box plot showing median, quartiles, and outliers

W tym ćwiczeniu obliczysz IQR i użyjesz go do znalezienia wartości odstających. Biblioteki pandas jako pd i numpy jako np są już załadowane, a zbiór danych food_consumption jest dostępny.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Oblicz łączną emisję CO₂ (co2_emission) dla każdego kraju, grupując dane według kraju i sumując wartości co2_emission. Wynikowy DataFrame zapisz jako emissions_by_country.