1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracyjna analiza danych w R

Connected

ćwiczenie

Obliczanie miar środkowych

W tym rozdziale będziesz korzystać z danych ze zbioru gapminder, który śledzi dane demograficzne krajów na całym świecie w czasie. Aby dowiedzieć się więcej, wywołaj plik pomocy poleceniem ?gapminder.

W tym ćwiczeniu skupimy się na tym, jak oczekiwana długość życia różni się między kontynentami. Analiza będzie prowadzona nie na poziomie poszczególnych krajów, lecz po agregacji do poziomu kontynentu. Umożliwia to duet group_by() i summarize() – bardzo wygodna kombinacja do przeprowadzania tej samej analizy na różnych podzbiorach danych.

Instrukcje

100 XP
  • Utwórz zbiór danych o nazwie gap2007, który zawiera wyłącznie dane z roku 2007.
  • Korzystając z gap2007, oblicz średnią i medianę oczekiwanej długości życia dla każdego kontynentu. Nie musisz nadawać nazw nowym kolumnom tworzonym przez summarize().
  • Potwierdź zaobserwowane tendencje w medianach, generując wykresy pudełkowe oczekiwanej długości życia dla poszczególnych kontynentów, wyświetlone obok siebie.