LoslegenKostenlos loslegen

Zusammenhang zwischen Fahrtdauer und Gesamtfahrpreis

Wir würden erwarten, dass es einen Zusammenhang zwischen dem gesamten Taxipreis und der Dauer der Fahrt gibt. Da es zu viele Datenpunkte für ein Streudiagramm gibt, verwenden wir ein hexagonal gebinntes Diagramm, um diesen Zusammenhang zu untersuchen.

tx steht dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

Big Data mit Trelliscope in R visualisieren

Kurs anzeigen

Anleitung zur Übung

  • Verwende Hexagon-Bins, um die bivariate Verteilung von total_amount (y-Achse) vs. trip_duration (x-Achse) zu visualisieren.
  • Setze das Argument bins von geom_hex() auf 75.
  • Da beide Variablen stark schief verteilt sind, skaliere sowohl die x- als auch die y-Achse auf Logarithmus Basis 10. Beachte, dass diese Transformationen einige Warnungen erzeugen, da es relativ wenige Datensätze mit null Fahrtdauer oder Fahrpreis gibt.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

library(ggplot2)

# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
  ___ +
  ___ +
  ___
Code bearbeiten und ausführen