Vergelijk de verdeling van het totaalbedrag per betaaltype
We zagen dat er geen fooi is bij contante betalingen. Betekent dit dat mensen die contant betalen geen fooi geven, of dat fooien niet worden geregistreerd bij contante betalingen? Voor vergelijkbare ritten zouden we verwachten dat de verdelingen van het totale bedrag identiek zijn, ongeacht het betaaltype. In deze oefening maken we een kwantielenplot waarin we de verdeling van het totale bedrag per betaaltype vergelijken en zetten we die naast de oorspronkelijke plot in een andere facet.
Er is een gegevensset amount_compare voor je klaargezet met de variabelen payment_type, amount en amount_type. amount_type maakt onderscheid tussen waarden die een totale betaling weergeven versus een betaling zonder fooi.
Deze oefening maakt deel uit van de cursus
Grote datasets visualiseren met Trelliscope in R
Oefeninstructies
- Bekijk eerst de
amount_compare-gegevensset door deze naar de console te printen, zodat je de structuur begrijpt en de plot goed kunt specificeren. - Gebruik
geom_qq()om een kwantielenplot te maken van het totale bedrag,amount. Zorg ervoor dat jedistribution = stats::qunifopgeeft. - Zorg dat er aparte kwantielenplots worden gemaakt voor elk betaaltype door te
coloren op betaaltype, zodat elke verdeling over dezelfde plot heen ligt. - Laat de verdelingsvergelijkingen voor elke
amount_typezien met faceting.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
library(ggplot2)
library(dplyr)
library(tidyr)
# Get data ready to plot
amount_compare <- tx_pop %>%
mutate(total_no_tip = total_amount - tip_amount) %>%
select(total_amount, total_no_tip, payment_type) %>%
pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")
# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
geom_qq(distribution = ___, shape = 21) +
facet_wrap(~ ___) +
ylim(c(3, 20))