1. Nauka
  2. /
  3. Kursy
  4. /
  5. Najlepsze praktyki wizualizacji danych w R

Connected

ćwiczenie

Szerokość przedziału a kontekst danych

Dostarczony kod pokazuje rozkład cytatów według godziny dnia. Zwróć uwagę, że słupki nie wypadają dokładnie na pełnych godzinach, co trochę utrudnia ich interpretację. Gdy dane mają naturalne punkty podziału, warto je wykorzystać. W tym przypadku możemy ustawić granice przedziałów tak, by pokrywały się z pełnymi godzinami.

Zmodyfikuj geom_histogram(), ustawiając binwidth na 1 godzinę. Ten argument nie mówi jednak ggplot, od którego miejsca zacząć przedziały – domyślnie wyznacza to zakres danych. Żeby to naprawić, ustaw argument center na 0.5. Oznacza to, że jeden ze słupków ma być wycentrowany na 30 minutach po północy – ggplot rozmieszcza pozostałe słupki odpowiednio. (Możesz też użyć dowolnej pełnej godziny + 0,5, np. 2,5; 3,5 itd.)

Instrukcje

100 XP
  • Ustaw binwidth wykresu na 1.
  • Wyśrodkuj słupki na połowie godziny, używając argumentu center.