1. Aprender
  2. /
  3. Cursos
  4. /
  5. Úvod do statistiky v Pythonu

Connected

Exercício

Hledání odlehlých hodnot pomocí IQR

Odlehlé hodnoty mohou výrazně ovlivnit statistiky jako průměr, ale také ukazatele, které na průměru závisí – například rozptyl nebo směrodatnou odchylku. Interkvartilové rozpětí, zkráceně IQR, je další způsob měření variability, který je vůči odlehlým hodnotám odolnější. IQR se také běžně používá k jejich hledání. Hodnota se považuje za odlehlou, pokud je menší než \(\text{Q1} - 1.5 \times \text{IQR}\) nebo větší než \(\text{Q3} + 1.5 \times \text{IQR}\). Přesně takto se ostatně počítá délka vousů v krabicovém grafu knihovny matplotlib.

Diagram of a box plot showing median, quartiles, and outliers

V tomto cvičení vypočítáš IQR a použiješ ho k nalezení odlehlých hodnot. Knihovny pandas jako pd a numpy jako np jsou načteny a datová sada food_consumption je k dispozici.

Instruções 1/4

undefined XP
    1
    2
    3
    4
  • Vypočítej celkové emise co2_emission za každou zemi tak, že seskupíš data podle země a sečteš hodnoty co2_emission. Výsledný DataFrame ulož jako emissions_by_country.