ComenzarEmpieza gratis

Relación entre la duración del viaje y la tarifa total

Cabe esperar que exista una relación entre la tarifa total del taxi y la duración del viaje. Como hay demasiados puntos para hacer un diagrama de dispersión, usemos un gráfico con celdas hexagonales para investigar esta relación.

tx está disponible en tu espacio de trabajo.

Este ejercicio forma parte del curso

Visualizar Big Data con Trelliscope en R

Ver curso

Instrucciones del ejercicio

  • Usa celdas hexagonales para visualizar la distribución bivariante de total_amount (eje y) frente a trip_duration (eje x).
  • Establece el argumento bins de geom_hex() en 75.
  • Como ambas variables están muy sesgadas, vuelve a escalar los ejes x e y a logaritmo en base 10. Ten en cuenta que estas transformaciones generarán algunas advertencias sobre un número relativamente pequeño de registros con duración del viaje o importe de la tarifa igual a cero.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

library(ggplot2)

# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
  ___ +
  ___ +
  ___
Editar y ejecutar código