Comparar la distribución de la tarifa por tipo de pago
Hemos visto que no hay propina en los pagos en efectivo. ¿Significa esto que quienes pagan en efectivo no dejan propina, o que las propinas no se registran cuando se paga en efectivo? Para rutas similares, esperaríamos que las distribuciones de la tarifa total fueran idénticas independientemente del tipo de pago. En este ejercicio, crearemos un gráfico de cuantiles que compare la distribución de la tarifa total por tipo de pago y lo compararemos con el gráfico original en un facet diferente.
Se ha creado para ti un conjunto de datos amount_compare que contiene las variables payment_type, amount y amount_type. amount_type distingue entre valores que reflejan un pago total y un pago sin propina.
Este ejercicio forma parte del curso
Visualizar Big Data con Trelliscope en R
Instrucciones del ejercicio
- Inspecciona el conjunto de datos
amount_compareantes de completar el ejercicio imprimiéndolo en la consola para entender su estructura y ayudarte con la especificación del gráfico. - Usa
geom_qq()para crear un gráfico de cuantiles del importe total de la tarifa,amount. Asegúrate de especificardistribution = stats::qunif. - Asegúrate de que se creen gráficos de cuantiles separados para cada tipo de pago usando
colorpor tipo de pago, de manera que cada distribución quede superpuesta en el mismo gráfico. - Muestra las comparaciones de distribución para cada
amount_typeusando facetas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
library(ggplot2)
library(dplyr)
library(tidyr)
# Get data ready to plot
amount_compare <- tx_pop %>%
mutate(total_no_tip = total_amount - tip_amount) %>%
select(total_amount, total_no_tip, payment_type) %>%
pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")
# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
geom_qq(distribution = ___, shape = 21) +
facet_wrap(~ ___) +
ylim(c(3, 20))