1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wizualizacja dużych zbiorów danych z Trelliscope w R

Connected

ćwiczenie

Rozkład napiwków z podziałem na typ płatności

Rozkład łącznej kwoty przejazdu, który wcześniej przeanalizowaliśmy, był interesujący – jednak możemy uzyskać dodatkowe informacje, sprawdzając, czy różni się on w zależności od innej zmiennej. W tym ćwiczeniu przyjrzymy się rozkładowi napiwków i zbadamy, czy jest on różny dla poszczególnych typów płatności. W tym celu stworzysz histogram i zastosujesz podział na panele według typu płatności.

tx jest wczytany do twojego środowiska pracy.

Instrukcje

100 XP
  • Utwórz histogram zmiennej tip_amount + 0.01 (dodajemy jeden cent do każdego napiwku, ponieważ zastosujemy transformację logarytmiczną, a niektóre napiwki mają wartość zero).
  • Użyj scale_x_log10(), aby przekształcić oś X.
  • Użyj facet_wrap(), aby podzielić wykres na panele według zmiennej payment_type. Aby ułatwić wizualne porównanie rozkładów, ustaw liczbę kolumn na 1 i pozwól osi Y być swobodna, ustawiając skale na "free_y".