Aan de slagGa gratis aan de slag

Relatie tussen ritduur en totale ritprijs

Je zou verwachten dat er een relatie is tussen de totale taxiprijs en de duur van de rit. Omdat er te veel punten zijn voor een scatterplot, gebruiken we een hexagon-binned plot om deze relatie te onderzoeken.

tx is beschikbaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

Grote datasets visualiseren met Trelliscope in R

Cursus bekijken

Oefeninstructies

  • Gebruik hexagon-bins om de bivariate verdeling van total_amount (y-as) versus trip_duration (x-as) te visualiseren.
  • Zet het bins-argument van geom_hex() op 75.
  • Omdat beide variabelen sterk scheef verdeeld zijn, herschaal je zowel de x- als de y-as naar log basis 10. Let op: deze transformaties leveren waarschuwingen op voor een relatief klein aantal records met een ritduur of ritprijs van nul.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

library(ggplot2)

# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
  ___ +
  ___ +
  ___
Code bewerken en uitvoeren