CommencerCommencer gratuitement

Qui est important dans la conversation ?

Les différentes mesures de centralité visent toutes un concept similaire : « quels sommets sont les plus importants ». Comme nous l’avons évoqué, ces deux métriques l’abordent de manière légèrement différente. Gardez à l’esprit que, même si elles peuvent produire des distributions de centralité similaires, le classement d’un sommet donné selon l’une ou l’autre peut diverger. Nous allons maintenant comparer les sommets les mieux classés parmi les utilisateurs de Twitter.

Les vecteurs qui stockent la centralité par valeurs propres et la centralité d’intermédiarité sont respectivement retweet_ec et retweet_btw.

Cet exercice fait partie du cours

Études de cas : l’analyse de réseaux avec R

Afficher le cours

Instructions

  • Calculez le quantile 0.99 de la centralité d’intermédiarité, retweet_btw.
  • Filtrez retweet_btw pour ne garder que les valeurs supérieures à ce quantile, soit le top 1 %.
  • Faites de même pour la centralité par valeurs propres, retweet_ec.
  • Exécutez le code qui place ces résultats dans un data frame et examinez-les.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Get 0.99 quantile of betweenness 
betweenness_q99 <- quantile(___, ___)

# Get top 1% of vertices by betweenness
top_btw <- ___[retweet_btw > ___]

# Get 0.99 quantile of eigen-centrality
eigen_centrality_q99 <- ___(___, ___)

# Get top 1% of vertices by eigen-centrality
top_ec <- ___

# See the results as a data frame
data.frame(
  Rank = seq_along(top_btw), 
  Betweenness = names(sort(top_btw, decreasing = TRUE)), 
  EigenCentrality = names(sort(top_ec, decreasing = TRUE))
)
Modifier et exécuter le code