1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wizualizacja dużych zbiorów danych z Trelliscope w R

Connected

ćwiczenie

Porównanie rozkładu opłat według typu płatności

Wiemy już, że przy płatnościach gotówką napiwki nie są odnotowywane. Czy oznacza to, że osoby płacące gotówką nie zostawiają napiwków – czy też po prostu nie są one rejestrowane? Dla podobnych tras oczekujemy, że rozkład łącznej opłaty będzie identyczny niezależnie od metody płatności. W tym ćwiczeniu stworzysz wykres kwantylowy porównujący rozkład łącznej opłaty według typu płatności, a następnie zestawisz go z oryginalnym wykresem w osobnym panelu.

Przygotowano dla ciebie zbiór danych amount_compare zawierający zmienne payment_type, amount oraz amount_type. Zmienna amount_type rozróżnia wartości odzwierciedlające całkowitą opłatę od opłaty bez napiwku.

Instrukcje

100 XP
  • Przed przystąpieniem do ćwiczenia zapoznaj się ze zbiorem danych amount_compare, wyświetlając go w konsoli – pomoże ci to zrozumieć jego strukturę i ułatwi specyfikację wykresu.
  • Użyj geom_qq(), aby utworzyć wykres kwantylowy łącznej kwoty opłaty (amount). Pamiętaj, aby ustawić distribution = stats::qunif.
  • Zadbaj o to, by dla każdego typu płatności powstał osobny wykres kwantylowy – użyj argumentu color z podziałem według typu płatności, tak aby rozkłady nakładały się na jednym wykresie.
  • Porównaj rozkłady dla każdego amount_type, stosując faceting.