1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Network Analysis in Python

Connected

Cvičení

Seznam grafů

V této sérii cvičení využiješ dataset zpráv mezi studenty na vysoké škole a naučíš se filtrovat grafy pro analýzu časových řad. V tomto datasetu jsou uzly studenti a hrany představují zprávy odeslané od jednoho studenta druhému. Graf v současné podobě zachycuje veškerou komunikaci napříč všemi časovými body.

Začneme analýzou grafů, ve kterých se v průběhu času mění pouze hrany.

Dataset je načtený do DataFrame s názvem data. Klidně si ho prozkoumej v IPython Shellu – zaměř se zejména na výstup data['sender'] a data['recipient'].

Pokyny

100 XP
  • Inicializuj prázdný seznam s názvem Gs.
  • Pomocí cyklu for iteruj přes months. Uvnitř cyklu:
    • Vytvoř nový neorientovaný graf s názvem G pomocí funkce nx.Graph().
    • Přidej do grafu všechny uzly, které se kdy objevily. Zavolej metodu .add_nodes_from() na G dvakrát – nejprve s argumentem data['sender'], poté s argumentem data['recipient'].
    • Vyfiltruj DataFrame tak, aby obsahoval pouze daný měsíc. Tento krok už máš připravený.
    • Přidej hrany z filtrovaného DataFrame pomocí metody .add_edges_from(), přičemž df_filtered['sender'] a df_filtered['recipient'] předej do zip().
    • Připoj G k seznamu grafů Gs.