Comparer la distribution du prix total selon le type de paiement

Nous avons constaté qu’il n’y a pas de pourboire pour les paiements en espèces. Cela signifie-t-il que les personnes qui paient en espèces ne laissent pas de pourboire, ou bien que les pourboires ne sont pas enregistrés lorsqu’on paie en espèces ? Pour des trajets similaires, nous nous attendrions à ce que les distributions du prix total soient identiques, quel que soit le type de paiement. Dans cet exercice, nous allons créer un graphique quantile comparant la distribution du prix total selon le type de paiement et le comparer au graphique initial dans une autre facette.

Un jeu de données amount_compare a été préparé pour vous. Il contient les variables payment_type, amount et amount_type. amount_type distingue les valeurs qui correspondent à un paiement total de celles d’un paiement sans pourboire.

Cet exercice fait partie du cours

Visualiser des Big Data avec Trelliscope en R

Afficher le cours

Instructions

Examinez le jeu de données amount_compare avant de réaliser l’exercice en l’affichant dans la console, afin de comprendre sa structure et de vous aider à définir le tracé.
Utilisez geom_qq() pour créer un graphique quantile du montant total, amount. Veillez à préciser distribution = stats::qunif.
Assurez-vous de produire des graphiques quantiles distincts pour chaque type de paiement en appliquant une couleur (color) selon payment_type, de sorte que chaque distribution soit superposée sur le même graphique.
Affichez la comparaison des distributions pour chaque amount_type à l’aide du facettage.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

library(ggplot2)
library(dplyr)
library(tidyr)

# Get data ready to plot
amount_compare <- tx_pop %>%
  mutate(total_no_tip = total_amount - tip_amount) %>%
  select(total_amount, total_no_tip, payment_type) %>%
  pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")

# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
  geom_qq(distribution = ___, shape = 21) +
  facet_wrap(~ ___) +
  ylim(c(3, 20))

Modifier et exécuter le code

Cet exercice fait partie du cours

Visualiser des Big Data avec Trelliscope en R

DébutantNiveau de compétence

4.8+

Commencer le cours gratuitement

Découvrez différentes stratégies pour tracer des big data avec ggplot2, notamment le calcul et la représentation de statistiques récapitulatives, diverses techniques pour traiter le sur-tracé, ainsi que les principes des petits multiples avec la facette, qui nous mène à Trelliscope.

Exercise 1: Visualiser des synthèses Exercise 2: Comptes quotidiens des trajets Exercise 3: Distribution du montant des courses en taxi Exercise 4: Répartition du type de paiement Exercise 5: Ajouter plus de détails aux synthèses Exercise 6: Lien entre la durée du trajet et le montant total Exercise 7: Facetter les trajets quotidiens Exercise 8: Répartition du pourboire, par type de paiement (facettes)Exercise 9: Visualiser des sous-ensembles Exercise 10: Comparer la distribution du prix total selon le type de paiement

Exercice en cours

Exercise 11: Visualiser tous les sous-ensembles

Au chapitre précédent, vous avez vu comment la facette peut être une technique puissante pour visualiser de grandes quantités de données qui se partitionnent naturellement de manière pertinente. À présent, avec le package trelliscopejs et ggplot2, vous allez apprendre à créer des visualisations avec facettes lorsque le nombre de partitions devient trop important pour être consulté efficacement sur un seul écran.

Exercise 1: Facetter avec TrelliscopeJS Exercise 2: Facettage Trelliscope de gapminder par pays Exercise 3: Interagir avec les affichages TrelliscopeJS Exercise 4: Interagir avec l’affichage Exercise 5: Fonctionnalités supplémentaires de TrelliscopeJS Exercise 6: Personnaliser l’affichage gapminder Exercise 7: Examiner les nouveaux cognostics Exercise 8: Ajouter vos propres cognostics Exercise 9: Ajouter des cognostics personnalisés Exercise 10: Interpréter des cognitifs personnalisés

L’interface ggplot2 + trelliscopejs est simple à utiliser, mais trelliscopejs propose aussi un mécanisme de tracé en facettes qui vous offre bien plus de flexibilité quant au système de graphiques utilisé et à la manière de définir les « cognostics ». Vous allez découvrir tout cela dans ce chapitre !

Exercise 1: Trelliscope dans le tidyverse Exercise 2: Regrouper et imbriquer Exercise 3: Affichage du cours de l’action Exercise 4: Explorer l’affichage Exercise 5: Cognostics Exercise 6: Ajouter des cognostics Exercise 7: Cognostics à partir de data frames imbriqués Exercise 8: Explorer les graphiques boursiers avec de nouveaux cognostics Exercise 9: Options de Trelliscope Exercise 10: Personnaliser l’affichage boursier Exercise 11: Visualiser des bases de données d’images Exercise 12: Visualiser les Pokémon Exercise 13: Le Pokémon le plus puissant

<a href="https://www.bixi.com" target="_blank">Le réseau de vélos BIXI de Montréal</a> met à disposition des données ouvertes pour chaque trajet, incluant la date, l’heure, la durée, ainsi que les stations de départ et d’arrivée. Dans ce chapitre, vous analyserez des données portant sur plus de 4 millions de trajets en 2017, répartis entre 546 stations. De nombreuses questions exploratoires intéressantes peuvent être posées à partir de ces données, et vous créerez des visualisations exploratoires allant des statistiques récapitulatives à des visualisations Trelliscope détaillées qui vous donneront des éclairages pertinents sur les données.

Exercise 1: Données des vélos BIXI de Montréal Exercise 2: Nombre de trajets quotidiens Exercise 3: Examiner le moment de la journée Exercise 4: Effet de l’adhésion et du jour de la semaine Exercise 5: Récapitulatif : visualisations de synthèse Exercise 6: Graphiques quotidiens Exercise 7: Explorer tous les jours Exercise 8: Jeu de données des 100 itinéraires principaux Exercise 9: Enrichir les données : statistiques récapitulatives des trajets Exercise 10: Visualiser les données : décomptes par heure de la journée Exercise 11: Évaluer la visualisation Exercise 12: Goodbye