Qui est important dans la conversation ?

Les différentes mesures de centralité visent toutes un concept similaire : « quels sommets sont les plus importants ». Comme nous l’avons évoqué, ces deux métriques l’abordent de manière légèrement différente. Gardez à l’esprit que, même si elles peuvent produire des distributions de centralité similaires, le classement d’un sommet donné selon l’une ou l’autre peut diverger. Nous allons maintenant comparer les sommets les mieux classés parmi les utilisateurs de Twitter.

Les vecteurs qui stockent la centralité par valeurs propres et la centralité d’intermédiarité sont respectivement retweet_ec et retweet_btw.

Cet exercice fait partie du cours

Études de cas : l’analyse de réseaux avec R

Afficher le cours

Instructions

Calculez le quantile 0.99 de la centralité d’intermédiarité, retweet_btw.
Filtrez retweet_btw pour ne garder que les valeurs supérieures à ce quantile, soit le top 1 %.
Faites de même pour la centralité par valeurs propres, retweet_ec.
Exécutez le code qui place ces résultats dans un data frame et examinez-les.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Get 0.99 quantile of betweenness 
betweenness_q99 <- quantile(___, ___)

# Get top 1% of vertices by betweenness
top_btw <- ___[retweet_btw > ___]

# Get 0.99 quantile of eigen-centrality
eigen_centrality_q99 <- ___(___, ___)

# Get top 1% of vertices by eigen-centrality
top_ec <- ___

# See the results as a data frame
data.frame(
  Rank = seq_along(top_btw), 
  Betweenness = names(sort(top_btw, decreasing = TRUE)), 
  EigenCentrality = names(sort(top_ec, decreasing = TRUE))
)

Modifier et exécuter le code

Cet exercice fait partie du cours

Études de cas : l’analyse de réseaux avec R

DébutantNiveau de compétence

4.8+

Commencer le cours gratuitement

Dans ce chapitre, vous explorerez un sous‑ensemble d’un graphe d’achats Amazon. Vous vous appuierez sur ce que vous avez déjà appris pour repérer des produits importants et comprendre ce qui motive les achats. Vous examinerez aussi comment les graphes évoluent dans le temps en observant le graphe sur différentes périodes.

Exercise 1: Explorer votre jeu de données Exercise 2: Identifier les dyades et les triades Exercise 3: Regroupement et réciprocité Exercise 4: Produits importants Exercise 5: Qu’est-ce qui fait l’importance d’un produit ?Exercise 6: Explorer la structure temporelle Exercise 7: Mesures dans le temps Exercise 8: Tracer des métriques au fil du temps

Dans cette leçon, vous étudierez des données Twitter sur R en examinant les conversations utilisant « #rstats ». Vous commencerez par regarder les données brutes et réfléchir à la manière de construire votre graphe. Il existe plusieurs approches ; nous en couvrirons deux : les retweets et les mentions. Vous construirez ces graphes, puis vous les comparerez selon plusieurs métriques.

Exercise 1: Créer votre graphe de retweets Exercise 2: Visualiser le graphe Exercise 3: Visualiser les nœuds selon leur degré Exercise 4: Quelle est la distribution de la centralité ?Exercise 5: Qui est important dans la conversation ?

Exercice en cours

Exercise 6: Tracer les sommets importants Exercise 7: Construire un graphe des mentions Exercise 8: Comparer les graphes de mentions et de retweets Exercise 9: Assortativité et réciprocité Exercise 10: Identifier qui parle à qui Exercise 11: Identifier des communautés Exercise 12: Comparer les algorithmes de détection de communautés Exercise 13: Visualiser les communautés

Dans ce chapitre, vous allez analyser des données issues d’un réseau de vélos en libre‑service de Chicago. Nous nous appuierons sur les notions déjà vues dans le cours d’introduction et nous en ajouterons quelques‑unes pour gérer des graphes à arêtes pondérées. Vous partirez également de données un peu plus brutes et verrez comment construire votre graphe à partir d’une source de données que vous pourriez rencontrer.

Exercise 1: Créer notre graphe à partir de données brutes Exercise 2: Créer des graphes selon les types d’utilisateurs Exercise 3: Comparer les graphes selon les types d’utilisateurs Exercise 4: Comparer la distance dans le graphe et la distance géographique Exercise 5: Comparer les distances Abonné vs Non-abonné Exercise 6: Stations les plus fréquentées en départ et en arrivée Exercise 7: Stations les plus fréquentées au départ et à l’arrivée avec poids Exercise 8: Visualiser les sommets centraux Exercise 9: Mesures pondérées de centralité Exercise 10: Connectivité Exercise 11: Trouver la coupe minimale 1 Exercise 12: Trouver la coupe minimale 2 Exercise 13: Randomisations du coefficient de regroupement non pondéré Exercise 14: Randomisations de clustering pondéré

Jusqu’ici, nous avons tout tracé avec igraph, qui offre de nombreuses façons puissantes de visualiser vos données de graphe. Cependant, beaucoup préfèrent interagir avec d’autres cadres de tracé comme ggplot2, ou même des frameworks interactifs comme d3.js. Dans cette leçon, vous découvrirez d’autres bibliothèques de visualisation qui s’appuient sur l’écosystème ggplot2. Vous verrez aussi d’autres méthodes non « hairball », comme les hive plots, ainsi que la création de graphiques interactifs et animés.

Exercise 1: Autres packages pour visualiser des graphes !Exercise 2: Bases de ggnet Exercise 3: Notions de base de ggnetwork Exercise 4: Plus d’options de tracé avec ggnet Exercise 5: Plus d’options de tracé avec ggnetwork Exercise 6: Visualisations interactives Exercise 7: Graphiques interactifs avec ggiraph Exercise 8: Graphiques interactifs en JavaScript Exercise 9: Visualisations alternatives Exercise 10: Autres façons de visualiser un graphe : les hive plots Exercise 11: BioFabric en widget HTML Exercise 12: Tracer des graphes sur une carte