Arricchire i dati: statistiche riassuntive delle rotte
Abbiamo costruito un insieme di dati quasi pronto per la visualizzazione, route_hod. Aggiungiamo qualche variabile in più che sarà utile come cognostics, in vista dell’esplorazione interattiva del display.
Questo esercizio fa parte del corso
Visualizzare Big Data con Trelliscope in R
Istruzioni dell'esercizio
- Per ogni rotta, calcola il numero totale di corse.
- Per ogni rotta, calcola la differenza tra la media oraria delle corse nei giorni lavorativi e la media oraria delle corse nel weekend. Nota che la variabile
nè già aggregata a conteggi per ora, quindi, per esempio, la media dei giorni lavorativi si calcola conmean(n[weekday == "workweek"]). - Per ogni rotta, aggiungi una variabile contenente un URL che punta alla rotta su Google Maps, usando la funzione fornita
make_gmap_urle passando gli argomenti appropriati dai dati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
library(trelliscopejs)
library(ggplot2)
library(dplyr)
# Function to construct a Google maps URL with cycling directions
make_gmap_url <- function(start_lat, start_lon, end_lat, end_lon) {
paste0("https://www.google.com/maps/dir/?api=1",
"&origin=", start_lat, ",", start_lon,
"&destination=", end_lat, ",", end_lon,
"&travelmode=bicycling")
}
# Compute tot_rides, weekday_diff, and map_url
route_hod_updated <- route_hod %>% ungroup() %>%
group_by(start_station_code, end_station_code) %>%
mutate(
tot_rides = sum(___),
weekday_diff = mean(n[weekday == "workweek"]) - ___,
map_url = ___)