Facetteren van ritten per dag
We zagen interessant gedrag toen we het aantal ritten per dag, gefacetteerd naar weekdag, bekeken. Laten we onderzoeken of facetteren op extra variabelen nieuwe inzichten oplevert. We kijken hier of er verschillende patronen per weekdag zijn als we ook naar de betaaltypes contant of creditcard kijken.
tx is beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Grote datasets visualiseren met Trelliscope in R
Oefeninstructies
- Filter eerst op alleen contant- en credittransacties. Maak daarna met
dplyreen samenvatting per weekdag en betaaltype door te groeperen oppickup_date,pickup_dow,payment_type. - Tel binnen
summarise()het aantal ritten en ken het resultaat toe aan een nieuwe variabelen_rides. - Plot het resultaat door de samenvattingsgegevens
daily_countals invoer te gebruiken voorggplot()engeom_point()toe te passen, metpickup_dateop de x-as enn_ridesop de y-as. - Gebruik
facet_grid()om te facetteren metpayment_typeals rijen en weekdagpickup_dowals kolommen. - Merk op dat de code
coord_fixed()de beeldverhouding van de resulterende plot vastzet om patronen visueel beter te benadrukken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
library(dplyr)
library(ggplot2)
# Summarize taxi rides count by payment type, pickup date, pickup day of week
daily_count <- tx %>%
filter(payment_type %in% c("Card", "Cash")) %>%
group_by(___, ___, ___) %>%
summarise(___)
# Plot the data
ggplot(___, aes(___, ___)) +
___ +
facet_grid(___ ~ ___) +
coord_fixed(ratio = 0.4)