Verdeling van taxiritbedrag
Laten we ontdekken hoeveel taxiritten in NYC kosten en een histogram bekijken van het totale ritbedrag. Omdat het bedrag waarschijnlijk sterk scheef verdeeld is, plotten we de x-as op een log-schaal.
De tx-gegevensset is alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Grote datasets visualiseren met Trelliscope in R
Oefeninstructies
- Plot de verdeling van het totale taxiritbedrag,
total_amount, metgeom_histogram(). - Pas in de laatste regel een log-schaal met grondtal 10 toe op de x-as met
scale_x_log10(). Let op: je krijgt een waarschuwing over 62 datapunten met een totaalbedrag van $0. Deze punten worden genegeerd omdat de logaritme oneindig is.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
library(ggplot2)
# Create a histogram of total_amount
ggplot(___, aes(___)) +
___ +
___