LoslegenKostenlos starten

Zusammenhang zwischen Fahrtdauer und Gesamtfahrpreis

Wir würden erwarten, dass es einen Zusammenhang zwischen dem gesamten Taxipreis und der Dauer der Fahrt gibt. Da es zu viele Datenpunkte für ein Streudiagramm gibt, verwenden wir ein hexagonal gebinntes Diagramm, um diesen Zusammenhang zu untersuchen.

tx steht dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Big Data mit Trelliscope in R visualisieren</Kurs>
Kurs ansehen

Übungsanweisungen

  • Verwende Hexagon-Bins, um die bivariate Verteilung von total_amount (y-Achse) vs. trip_duration (x-Achse) zu visualisieren.
  • Setze das Argument bins von geom_hex() auf 75.
  • Da beide Variablen stark schief verteilt sind, skaliere sowohl die x- als auch die y-Achse auf Logarithmus Basis 10. Beachte, dass diese Transformationen einige Warnungen erzeugen, da es relativ wenige Datensätze mit null Fahrtdauer oder Fahrpreis gibt.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

library(ggplot2)

# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
  ___ +
  ___ +
  ___
Code bearbeiten und ausführen