CommencerCommencer gratuitement

Comparer la distribution du prix total selon le type de paiement

Nous avons constaté qu’il n’y a pas de pourboire pour les paiements en espèces. Cela signifie-t-il que les personnes qui paient en espèces ne laissent pas de pourboire, ou bien que les pourboires ne sont pas enregistrés lorsqu’on paie en espèces ? Pour des trajets similaires, nous nous attendrions à ce que les distributions du prix total soient identiques, quel que soit le type de paiement. Dans cet exercice, nous allons créer un graphique quantile comparant la distribution du prix total selon le type de paiement et le comparer au graphique initial dans une autre facette.

Un jeu de données amount_compare a été préparé pour vous. Il contient les variables payment_type, amount et amount_type. amount_type distingue les valeurs qui correspondent à un paiement total de celles d’un paiement sans pourboire.

Cet exercice fait partie du cours

Visualiser des Big Data avec Trelliscope en R

Afficher le cours

Instructions

  • Examinez le jeu de données amount_compare avant de réaliser l’exercice en l’affichant dans la console, afin de comprendre sa structure et de vous aider à définir le tracé.
  • Utilisez geom_qq() pour créer un graphique quantile du montant total, amount. Veillez à préciser distribution = stats::qunif.
  • Assurez-vous de produire des graphiques quantiles distincts pour chaque type de paiement en appliquant une couleur (color) selon payment_type, de sorte que chaque distribution soit superposée sur le même graphique.
  • Affichez la comparaison des distributions pour chaque amount_type à l’aide du facettage.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

library(ggplot2)
library(dplyr)
library(tidyr)

# Get data ready to plot
amount_compare <- tx_pop %>%
  mutate(total_no_tip = total_amount - tip_amount) %>%
  select(total_amount, total_no_tip, payment_type) %>%
  pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")

# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
  geom_qq(distribution = ___, shape = 21) +
  facet_wrap(~ ___) +
  ylim(c(3, 20))
Modifier et exécuter le code