1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în Statistică cu Python

Connected

exercițiu

Identificarea valorilor extreme cu IQR

Valorile extreme pot influența semnificativ statistici precum media, dar și statisticile derivate din ea, cum ar fi varianța și deviația standard. Intervalul interquartilic, sau IQR, este o altă metodă de măsurare a dispersiei, mai puțin sensibilă la valorile extreme. IQR este folosit adesea și pentru a identifica valorile extreme. Dacă o valoare este mai mică decât \(\text{Q1} - 1,5 \times \text{IQR}\) sau mai mare decât \(\text{Q3} + 1,5 \times \text{IQR}\), aceasta este considerată o valoare extremă. De fapt, exact așa se calculează lungimea mustăților într-un box plot creat cu matplotlib.

Diagram of a box plot showing median, quartiles, and outliers

În acest exercițiu, vei calcula IQR și îl vei folosi pentru a identifica câteva valori extreme. pandas a fost importat ca pd, numpy ca np, iar setul de date food_consumption este disponibil.

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Calculează emisiile totale de co2_emission per țară, grupând după țară și calculând suma valorilor co2_emission. Stochează DataFrame-ul rezultat ca emissions_by_country.