Relatie tussen ritduur en totale ritprijs
Je zou verwachten dat er een relatie is tussen de totale taxiprijs en de duur van de rit. Omdat er te veel punten zijn voor een scatterplot, gebruiken we een hexagon-binned plot om deze relatie te onderzoeken.
tx is beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Grote datasets visualiseren met Trelliscope in R
Oefeninstructies
- Gebruik hexagon-bins om de bivariate verdeling van
total_amount(y-as) versustrip_duration(x-as) te visualiseren. - Zet het
bins-argument vangeom_hex()op 75. - Omdat beide variabelen sterk scheef verdeeld zijn, herschaal je zowel de x- als de y-as naar log basis 10. Let op: deze transformaties leveren waarschuwingen op voor een relatief klein aantal records met een ritduur of ritprijs van nul.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
library(ggplot2)
# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
___ +
___ +
___