1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Exploratory Data Analysis in R

Connected

cvičení

Identifikace odlehlých hodnot

Podívej se na rozložení střední délky života obyvatel asijských zemí zobrazené níže. Krabicový graf (box plot) jasně ukazuje jednu odlehlou hodnotu: zemi s nápadně nízkou střední délkou života. Tipuješ, která země to může být? Svůj tip ověř v konzoli pomocí min() nebo filter() a pak přejdi k vytvoření grafu bez této země.

Pokyny

100 XP

gap2007 je stále k dispozici ve tvém pracovním prostředí.

  • Aplikuj filtr tak, aby datová sada obsahovala pouze záznamy z Asie, a pak vytvoř novou proměnnou is_outlier, která bude mít hodnotu TRUE pro země se střední délkou života nižší než 50. Výsledek ulož do gap_asia.
  • Filtruj gap_asia tak, aby byly odstraněny všechny odlehlé hodnoty, a vytvoř krabicový graf (box plot) ze zbývajících hodnot střední délky života.