IniziaInizia gratis

Relazione tra durata del viaggio e tariffa totale

È ragionevole aspettarsi una relazione tra la tariffa totale del taxi e la durata del viaggio. Dato che ci sono troppi punti per fare uno scatterplot, usiamo un grafico con bin esagonali per indagare questa relazione.

tx è già disponibile nel tuo workspace.

Questo esercizio fa parte del corso

Visualizzare Big Data con Trelliscope in R

Visualizza il corso

Istruzioni dell'esercizio

  • Usa bin esagonali per visualizzare la distribuzione bivariata di total_amount (asse y) vs. trip_duration (asse x).
  • Imposta l'argomento bins di geom_hex() a 75.
  • Poiché entrambe le variabili sono fortemente asimmetriche, riparametra sia l'asse x sia l'asse y in scala log base 10. Nota che queste trasformazioni genereranno alcuni avvisi relativi a un numero relativamente piccolo di record con durata del viaggio o importo della tariffa pari a zero.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

library(ggplot2)

# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
  ___ +
  ___ +
  ___
Modifica ed esegui il codice