Facetter les trajets quotidiens
Nous avons remarqué un comportement intéressant en examinant le nombre de trajets par jour, faceté par jour de la semaine. Voyons si le facettage selon des variables supplémentaires apporte de nouvelles idées. Ici, nous vérifierons s’il existe des schémas différents selon le jour de la semaine en tenant aussi compte du mode de paiement : espèces ou carte de crédit.
tx est disponible dans votre espace de travail.
Cet exercice fait partie du cours
Visualiser des Big Data avec Trelliscope en R
Instructions
- Après avoir filtré pour ne conserver que les transactions en espèces et par carte, créez un résumé par jour de la semaine et type de paiement avec
dplyr, en groupant parpickup_date,pickup_dow,payment_type. - Dans
summarise(), comptez le nombre de trajets et affectez le résultat à une nouvelle variablen_rides. - Tracez le résultat en utilisant le jeu de données de synthèse
daily_countcomme entrée deggplot()etgeom_point(), avecpickup_datesur l’axe des x etn_ridessur l’axe des y. - Utilisez
facet_grid()pour facetter avecpayment_typeen lignes et le jour de la semainepickup_dowen colonnes. - Notez que le code
coord_fixed()contraint le rapport d’aspect du graphique afin de mieux faire ressortir visuellement les motifs.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
library(dplyr)
library(ggplot2)
# Summarize taxi rides count by payment type, pickup date, pickup day of week
daily_count <- tx %>%
filter(payment_type %in% c("Card", "Cash")) %>%
group_by(___, ___, ___) %>%
summarise(___)
# Plot the data
ggplot(___, aes(___, ___)) +
___ +
facet_grid(___ ~ ___) +
coord_fixed(ratio = 0.4)