Stations les plus fréquentées en départ et en arrivée
Ici, nous allons voir quelles stations sont les plus souvent utilisées comme points de départ et d’arrivée, ainsi que le ratio entre le degré entrant et le degré sortant. Cela nous indiquera quelles stations sont déséquilibrées, soit parce que beaucoup d’autres stations y prélèvent des vélos, soit parce qu’on y laisse beaucoup de vélos. Pour qu’un réseau de vélos en libre-service comme celui-ci fonctionne correctement, il ne doit pas y avoir trop de stations « sources » ou « puits » ; sinon, l’exploitant devrait déplacer des vélos en permanence ! Idéalement, le réseau est conçu pour s’autoréguler et, si c’est le cas, on s’attend à ce que la quasi-totalité des stations aient un ratio degré entrant/sortant proche de 1. Commençons par examiner le cas non pondéré.
Cet exercice fait partie du cours
Études de cas : l’analyse de réseaux avec R
Instructions
- Créez un data frame contenant les colonnes suivantes.
trip_outdoit contenir la distribution des degrés"out"detrip_g_simp.trip_indoit contenir la distribution des degrés"in".ratiodoit contenir le rapport des degrés "out" divisés par les degrés "in".
- Filtrez
trip_degpour ne garder que les lignes oùtrip_outettrip_insont tous deux supérieurs à10. - Tracez un histogramme des ratios filtrés.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
trip_deg <- data_frame(
# Find the "out" degree distribution
trip_out = degree(___, mode = "___"),
# ... and the "in" degree distribution
trip_in = degree(___, mode = "in")
# Calculate the ratio of out / in
ratio = ___ / trip_in
)
trip_deg_filtered <- trip_deg %>%
# Filter for rows where trips in and out are both over 10
___(___ > 10, ___ > 10)
# Plot histogram of filtered ratios
hist(___$ratio)