Aan de slagGa gratis aan de slag

Vergelijk de verdeling van het totaalbedrag per betaaltype

We zagen dat er geen fooi is bij contante betalingen. Betekent dit dat mensen die contant betalen geen fooi geven, of dat fooien niet worden geregistreerd bij contante betalingen? Voor vergelijkbare ritten zouden we verwachten dat de verdelingen van het totale bedrag identiek zijn, ongeacht het betaaltype. In deze oefening maken we een kwantielenplot waarin we de verdeling van het totale bedrag per betaaltype vergelijken en zetten we die naast de oorspronkelijke plot in een andere facet.

Er is een gegevensset amount_compare voor je klaargezet met de variabelen payment_type, amount en amount_type. amount_type maakt onderscheid tussen waarden die een totale betaling weergeven versus een betaling zonder fooi.

Deze oefening maakt deel uit van de cursus

Grote datasets visualiseren met Trelliscope in R

Cursus bekijken

Oefeninstructies

  • Bekijk eerst de amount_compare-gegevensset door deze naar de console te printen, zodat je de structuur begrijpt en de plot goed kunt specificeren.
  • Gebruik geom_qq() om een kwantielenplot te maken van het totale bedrag, amount. Zorg ervoor dat je distribution = stats::qunif opgeeft.
  • Zorg dat er aparte kwantielenplots worden gemaakt voor elk betaaltype door te coloren op betaaltype, zodat elke verdeling over dezelfde plot heen ligt.
  • Laat de verdelingsvergelijkingen voor elke amount_type zien met faceting.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

library(ggplot2)
library(dplyr)
library(tidyr)

# Get data ready to plot
amount_compare <- tx_pop %>%
  mutate(total_no_tip = total_amount - tip_amount) %>%
  select(total_amount, total_no_tip, payment_type) %>%
  pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")

# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
  geom_qq(distribution = ___, shape = 21) +
  facet_wrap(~ ___) +
  ylim(c(3, 20))
Code bewerken en uitvoeren