Wie is belangrijk in het gesprek?
Verschillende centraliteitsmaten proberen allemaal hetzelfde concept te vangen: "welke knopen zijn het belangrijkst." Zoals we eerder bespraken, pakken deze twee statistieken dat net iets anders aan. Houd er rekening mee dat hoewel ze een vergelijkbare verdeling van centraliteitswaarden kunnen opleveren, de rangorde van een individuele knoop per maat kan verschillen. We gaan nu de hoogst scorende knopen van Twitter-gebruikers vergelijken.
De vectoren met respectievelijk eigenvector- en betweenness-centraliteit zijn opgeslagen als retweet_ec en retweet_btw.
Deze oefening maakt deel uit van de cursus
Casestudies: netwerkanalyse in R
Oefeninstructies
- Bereken het
0.99-kwantiel van de betweenness,retweet_btw. - Maak een subset van
retweet_btwmet waarden groter dan dit kwantiel om de bovenste 1% te behouden. - Doe hetzelfde voor eigenvector-centraliteit,
retweet_ec. - Voer de code uit die dit in een data frame zet en bekijk de resultaten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Get 0.99 quantile of betweenness
betweenness_q99 <- quantile(___, ___)
# Get top 1% of vertices by betweenness
top_btw <- ___[retweet_btw > ___]
# Get 0.99 quantile of eigen-centrality
eigen_centrality_q99 <- ___(___, ___)
# Get top 1% of vertices by eigen-centrality
top_ec <- ___
# See the results as a data frame
data.frame(
Rank = seq_along(top_btw),
Betweenness = names(sort(top_btw, decreasing = TRUE)),
EigenCentrality = names(sort(top_ec, decreasing = TRUE))
)