Enrichir les données : statistiques récapitulatives des trajets
Nous avons construit un jeu de données presque prêt pour la visualisation, route_hod. Ajoutons encore quelques variables utiles comme cognostics, en prévision d’une exploration interactive de l’affichage.
Cet exercice fait partie du cours
Visualiser des Big Data avec Trelliscope en R
Instructions
- Pour chaque trajet, calculez le nombre total de trajets.
- Pour chaque trajet, calculez la différence entre la moyenne horaire des trajets en semaine et la moyenne horaire des trajets le week-end. Notez que la variable
nest déjà agrégée au niveau horaire ; par exemple, la moyenne en semaine se calcule avecmean(n[weekday == "workweek"]). - Pour chaque trajet, ajoutez une variable contenant une URL pointant vers l’itinéraire sur Google Maps, en utilisant la fonction fournie
make_gmap_urlavec les arguments appropriés issus des données.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
library(trelliscopejs)
library(ggplot2)
library(dplyr)
# Function to construct a Google maps URL with cycling directions
make_gmap_url <- function(start_lat, start_lon, end_lat, end_lon) {
paste0("https://www.google.com/maps/dir/?api=1",
"&origin=", start_lat, ",", start_lon,
"&destination=", end_lat, ",", end_lon,
"&travelmode=bicycling")
}
# Compute tot_rides, weekday_diff, and map_url
route_hod_updated <- route_hod %>% ungroup() %>%
group_by(start_station_code, end_station_code) %>%
mutate(
tot_rides = sum(___),
weekday_diff = mean(n[weekday == "workweek"]) - ___,
map_url = ___)