1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în Statistică cu R

Connected

exercițiu

Identificarea valorilor extreme cu IQR

Intervalul intercuartilic, sau IQR, este o altă modalitate de a măsura dispersia datelor, mai puțin influențată de valorile extreme. IQR este folosit adesea și pentru a identifica valorile extreme. Dacă o valoare este mai mică decât \(\text{Q1} - 1.5 \times \text{IQR}\) sau mai mare decât \(\text{Q3} + 1.5 \times \text{IQR}\), aceasta este considerată o valoare extremă. De altfel, exact așa sunt calculate lungimile „mustăților" într-un grafic de tip box plot în ggplot2.

Diagram of a box plot showing median, quartiles, and outliers

În acest exercițiu, vei calcula IQR și îl vei folosi pentru a identifica câteva valori extreme. Bibliotecile dplyr și ggplot2 sunt deja încărcate, iar setul de date food_consumption este disponibil.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Calculează prima și a treia cuartilă ale variabilei co2_emission din food_consumption și stochează-le ca q1, respectiv q3.
  • Calculează intervalul intercuartilic (IQR) al variabilei co2_emission și stochează-l ca iqr.