Enrichir les données : statistiques récapitulatives des trajets
Nous avons construit un jeu de données presque prêt pour la visualisation, route_hod. Ajoutons encore quelques variables utiles comme cognostics, en prévision d’une exploration interactive de l’affichage.
Cet exercice fait partie du cours
<cours>Visualiser des Big Data avec Trelliscope en R</cours>Instructions de l’exercice
- Pour chaque trajet, calculez le nombre total de trajets.
- Pour chaque trajet, calculez la différence entre la moyenne horaire des trajets en semaine et la moyenne horaire des trajets le week-end. Notez que la variable
nest déjà agrégée au niveau horaire ; par exemple, la moyenne en semaine se calcule avecmean(n[weekday == "workweek"]). - Pour chaque trajet, ajoutez une variable contenant une URL pointant vers l’itinéraire sur Google Maps, en utilisant la fonction fournie
make_gmap_urlavec les arguments appropriés issus des données.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
library(trelliscopejs)
library(ggplot2)
library(dplyr)
# Function to construct a Google maps URL with cycling directions
make_gmap_url <- function(start_lat, start_lon, end_lat, end_lon) {
paste0("https://www.google.com/maps/dir/?api=1",
"&origin=", start_lat, ",", start_lon,
"&destination=", end_lat, ",", end_lon,
"&travelmode=bicycling")
}
# Compute tot_rides, weekday_diff, and map_url
route_hod_updated <- route_hod %>% ungroup() %>%
group_by(start_station_code, end_station_code) %>%
mutate(
tot_rides = sum(___),
weekday_diff = mean(n[weekday == "workweek"]) - ___,
map_url = ___)