1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Prediktivní analytika pomocí síťových dat v R

Connected

cvičení

Extrakce typů hran

V tomto cvičení propojíš ID zákazníků z dataframu zákazníků s hranlovým seznamem, abys zjistil/a, zda je každá hrana churn, non-churn, nebo smíšená. Pomocí funkce match() přidáš do hranového seznamu dva sloupce:

  1. fromLabel se stavem odchodu zákazníka ze sloupce from
  2. toLabel se stavem odchodu zákazníka ze sloupce to

Příkaz match(x, y) vrací vektor s pozicemi prvků x v y. Na obrázku výše je výsledek match(edgeList$from, customers$id) roven 1,1,1,2,2. Například čtvrtý řádek v edgeList$from, tedy zákazník s id 393, je druhým prvkem v customers$id. Churn label tohoto zákazníka je tedy customers[2,2], neboli 0. Obdobně získáš churn label pro všechny záznamy v edgeList$from takto: customers[match(edgeList$from, customers$id),2].

Pokyny

100 XP
  • Přidej do dataframu edgeList sloupec FromLabel s labely uzlů from – spáruj customers$id s edgeList$from a extrahuj customers$churn.
  • Totéž proveď pro hrany to a výsledný sloupec pojmenuj ToLabel.
  • Přidej do dataframu edgeList sloupec edgeType, který bude součtem sloupců FromLabel a ToLabel.
  • Pomocí funkce table() zobraz počty jednotlivých typů hran.