Relazione tra durata del viaggio e tariffa totale
È ragionevole aspettarsi una relazione tra la tariffa totale del taxi e la durata del viaggio. Dato che ci sono troppi punti per fare uno scatterplot, usiamo un grafico con bin esagonali per indagare questa relazione.
tx è già disponibile nel tuo workspace.
Questo esercizio fa parte del corso
Visualizzare Big Data con Trelliscope in R
Istruzioni dell'esercizio
- Usa bin esagonali per visualizzare la distribuzione bivariata di
total_amount(asse y) vs.trip_duration(asse x). - Imposta l'argomento
binsdigeom_hex()a 75. - Poiché entrambe le variabili sono fortemente asimmetriche, riparametra sia l'asse x sia l'asse y in scala log base 10. Nota che queste trasformazioni genereranno alcuni avvisi relativi a un numero relativamente piccolo di record con durata del viaggio o importo della tariffa pari a zero.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
library(ggplot2)
# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
___ +
___ +
___