1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracyjna analiza danych w R

Connected

ćwiczenie

Obliczanie miar rozproszenia

Rozszerzmy możliwości składni group_by() i summarize() o miary rozproszenia. Jeśli nie masz pewności, czy rozkład danych jest symetryczny, czy skośny, warto wziąć pod uwagę odporną miarę, taką jak IQR, obok standardowych miar wariancji i odchylenia standardowego.

Instrukcje

100 XP

Zbiór danych gap2007, który został utworzony we wcześniejszym ćwiczeniu, jest dostępny w twoim środowisku roboczym.

  • Dla każdego kontynentu w gap2007 podsumuj oczekiwaną długość życia, używając funkcji sd(), IQR() oraz n() zliczającej kraje. Nie ma potrzeby nazywania nowo powstałych kolumn. Funkcja n() użyta wewnątrz summarize() nie przyjmuje żadnych argumentów.
  • Porównaj graficznie rozproszenie tych rozkładów, tworząc nałożone na siebie wykresy gęstości oczekiwanej długości życia z podziałem na kontynenty.