Verteilung des Taxifahrpreises
Lass uns herausfinden, was Taxifahrten in NYC kosten, und ein Histogramm der gesamten Taxikosten ansehen. Da der Fahrpreis wahrscheinlich stark schief verteilt ist, stellen wir die x-Achse in einer logarithmischen Skala dar.
Der Datensatz tx ist für dich vorab geladen.
Diese Übung ist Teil des Kurses
Big Data mit Trelliscope in R visualisieren
Anleitung zur Übung
- Zeichne die Verteilung des gesamten Taxipreises
total_amountmitgeom_histogram(). - Wende in der letzten Zeile eine logarithmische Skala zur Basis 10 auf die x-Achse an, indem du
scale_x_log10()verwendest. Beachte, dass du eine Warnmeldung zu 62 Datenpunkten erhältst, die einen Gesamtpreis von $0 haben. Diese Punkte werden ignoriert, da der Logarithmus nicht definiert ist.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
library(ggplot2)
# Create a histogram of total_amount
ggplot(___, aes(___)) +
___ +
___