1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wizualizacja dużych zbiorów danych z Trelliscope w R

Connected

ćwiczenie

Podział przejazdów dziennych na panele

Podczas analizy dziennej liczby przejazdów z podziałem według dnia tygodnia zauważyliśmy ciekawe prawidłowości. Sprawdźmy teraz, czy uwzględnienie dodatkowych zmiennych przyniesie nowe spostrzeżenia. Przyjrzymy się, czy wzorce związane z dniem tygodnia różnią się w zależności od formy płatności – gotówką lub kartą kredytową.

W twoim środowisku pracy dostępny jest obiekt tx.

Instrukcje

100 XP
  • Po odfiltrowanie wyłącznie transakcji gotówkowych i kartą kredytową utwórz podsumowanie według dnia tygodnia i typu płatności, używając dplyr – grupuj według pickup_date, pickup_dow oraz payment_type.
  • Wewnątrz summarise() policz liczbę przejazdów i przypisz wynik do nowej zmiennej n_rides.
  • Zwizualizuj wynik, przekazując zbiór podsumowujący daily_count jako dane wejściowe do ggplot() i używając geom_point() – umieść pickup_date na osi x, a n_rides na osi y.
  • Użyj facet_grid(), aby podzielić wykres na panele: payment_type jako wiersze, a dzień tygodnia pickup_dow jako kolumny.
  • Zwróć uwagę, że kod coord_fixed() ustala proporcje wykresu, co ułatwia wizualne wychwycenie wzorców.