Relación entre la duración del viaje y la tarifa total
Cabe esperar que exista una relación entre la tarifa total del taxi y la duración del viaje. Como hay demasiados puntos para hacer un diagrama de dispersión, usemos un gráfico con celdas hexagonales para investigar esta relación.
tx está disponible en tu espacio de trabajo.
Este ejercicio forma parte del curso
Visualizar Big Data con Trelliscope en R
Instrucciones del ejercicio
- Usa celdas hexagonales para visualizar la distribución bivariante de
total_amount(eje y) frente atrip_duration(eje x). - Establece el argumento
binsdegeom_hex()en 75. - Como ambas variables están muy sesgadas, vuelve a escalar los ejes x e y a logaritmo en base 10. Ten en cuenta que estas transformaciones generarán algunas advertencias sobre un número relativamente pequeño de registros con duración del viaje o importe de la tarifa igual a cero.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
library(ggplot2)
# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
___ +
___ +
___