CommencerCommencer gratuitement

Créer un graphe à partir du DataFrame pandas

Commençons par créer un graphe à partir d’un DataFrame pandas. Dans cet exercice, vous allez créer un nouveau graphe bipartite en itérant sur la liste d’arêtes (qui est un objet DataFrame).

Pour simplifier, dans cette procédure de construction du graphe, toute arête entre un étudiant et un nœud de forum sera la « dernière » arête (dans le temps) correspondant à la dernière contribution de l’étudiant sur un forum sur l’ensemble de la période du jeu de données, même s’il existe des moyens d’éviter cela.

De plus, pour réduire le temps d’exécution de l’exercice, nous avons fourni une version sous‑échantillonnée de la liste d’arêtes sous le nom data. Explorez‑la dans l’IPython Shell pour vous familiariser avec sa structure.

Cet exercice fait partie du cours

Analyse de réseaux intermédiaire en Python

Afficher le cours

Instructions

  • Instanciez un nouveau graphe appelé G.
  • Ajoutez les nœuds de chacune des partitions. Utilisez la méthode .add_nodes_from() pour cela. Les deux partitions sont 'student' et 'forum'. Pour ajouter les nœuds de la partition 'student', par exemple, les arguments de .add_nodes_from() seront data['student'] et bipartite='student'.
  • Ajoutez chaque arête ainsi que la date de création de l’arête. Pour ce faire, utilisez la méthode .add_edge() dans la boucle, avec les arguments d['student'], d['forum'] et date=d['date'].

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

import networkx as nx

# Instantiate a new Graph: G
G = ____

# Add nodes from each of the partitions
____
____

# Add in each edge along with the date the edge was created
for r, d in data.iterrows():
    ____ 
Modifier et exécuter le code