Zusammenhang zwischen Fahrtdauer und Gesamtfahrpreis
Wir würden erwarten, dass es einen Zusammenhang zwischen dem gesamten Taxipreis und der Dauer der Fahrt gibt. Da es zu viele Datenpunkte für ein Streudiagramm gibt, verwenden wir ein hexagonal gebinntes Diagramm, um diesen Zusammenhang zu untersuchen.
tx steht dir in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
Big Data mit Trelliscope in R visualisieren
Anleitung zur Übung
- Verwende Hexagon-Bins, um die bivariate Verteilung von
total_amount(y-Achse) vs.trip_duration(x-Achse) zu visualisieren. - Setze das Argument
binsvongeom_hex()auf 75. - Da beide Variablen stark schief verteilt sind, skaliere sowohl die x- als auch die y-Achse auf Logarithmus Basis 10. Beachte, dass diese Transformationen einige Warnungen erzeugen, da es relativ wenige Datensätze mit null Fahrtdauer oder Fahrpreis gibt.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
library(ggplot2)
# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
___ +
___ +
___