Comparer la distribution du prix total selon le type de paiement
Nous avons constaté qu’il n’y a pas de pourboire pour les paiements en espèces. Cela signifie-t-il que les personnes qui paient en espèces ne laissent pas de pourboire, ou bien que les pourboires ne sont pas enregistrés lorsqu’on paie en espèces ? Pour des trajets similaires, nous nous attendrions à ce que les distributions du prix total soient identiques, quel que soit le type de paiement. Dans cet exercice, nous allons créer un graphique quantile comparant la distribution du prix total selon le type de paiement et le comparer au graphique initial dans une autre facette.
Un jeu de données amount_compare a été préparé pour vous. Il contient les variables payment_type, amount et amount_type. amount_type distingue les valeurs qui correspondent à un paiement total de celles d’un paiement sans pourboire.
Cet exercice fait partie du cours
Visualiser des Big Data avec Trelliscope en R
Instructions
- Examinez le jeu de données
amount_compareavant de réaliser l’exercice en l’affichant dans la console, afin de comprendre sa structure et de vous aider à définir le tracé. - Utilisez
geom_qq()pour créer un graphique quantile du montant total,amount. Veillez à préciserdistribution = stats::qunif. - Assurez-vous de produire des graphiques quantiles distincts pour chaque type de paiement en appliquant une couleur (
color) selonpayment_type, de sorte que chaque distribution soit superposée sur le même graphique. - Affichez la comparaison des distributions pour chaque
amount_typeà l’aide du facettage.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
library(ggplot2)
library(dplyr)
library(tidyr)
# Get data ready to plot
amount_compare <- tx_pop %>%
mutate(total_no_tip = total_amount - tip_amount) %>%
select(total_amount, total_no_tip, payment_type) %>%
pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")
# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
geom_qq(distribution = ___, shape = 21) +
facet_wrap(~ ___) +
ylim(c(3, 20))