CommencerCommencer gratuitement

Enrichir les données : statistiques récapitulatives des trajets

Nous avons construit un jeu de données presque prêt pour la visualisation, route_hod. Ajoutons encore quelques variables utiles comme cognostics, en prévision d’une exploration interactive de l’affichage.

Cet exercice fait partie du cours

Visualiser des Big Data avec Trelliscope en R

Afficher le cours

Instructions

  • Pour chaque trajet, calculez le nombre total de trajets.
  • Pour chaque trajet, calculez la différence entre la moyenne horaire des trajets en semaine et la moyenne horaire des trajets le week-end. Notez que la variable n est déjà agrégée au niveau horaire ; par exemple, la moyenne en semaine se calcule avec mean(n[weekday == "workweek"]).
  • Pour chaque trajet, ajoutez une variable contenant une URL pointant vers l’itinéraire sur Google Maps, en utilisant la fonction fournie make_gmap_url avec les arguments appropriés issus des données.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

library(trelliscopejs)
library(ggplot2)
library(dplyr)

# Function to construct a Google maps URL with cycling directions
make_gmap_url <- function(start_lat, start_lon, end_lat, end_lon) {
  paste0("https://www.google.com/maps/dir/?api=1",
    "&origin=", start_lat, ",", start_lon,
    "&destination=", end_lat, ",", end_lon,
    "&travelmode=bicycling")
}

# Compute tot_rides, weekday_diff, and map_url
route_hod_updated <- route_hod %>% ungroup() %>%
  group_by(start_station_code, end_station_code) %>%
  mutate(
    tot_rides = sum(___),
    weekday_diff = mean(n[weekday == "workweek"]) - ___,
    map_url = ___)
Modifier et exécuter le code