Typen edges extraheren
In deze oefening koppel je de klant-ID’s in de customer-dataframe aan de klant-edgelist om te bepalen of elke edge een churn-, non-churn- of gemengde edge is.
Met de functie match() voeg je twee kolommen toe aan de edgelist.
fromLabelmet de churnstatus van defrom-kolomtoLabelmet de churnstatus van deto-kolom

Het commando match(x, y) geeft een vector terug met de positie van x in y. In de bovenstaande figuur is match(edgeList$from, customers$id) 1,1,1,2,2. Bijvoorbeeld: de vierde regel in edgeList$from, de klant met id 393, is het tweede element in customers$id.
Het churnlabel van deze klant is daarom customers[2,2] of 0.
Op dezelfde manier is het churnlabel van iedereen in edgeList$from customers[match(edgeList$from, customers$id),2].
Deze oefening maakt deel uit van de cursus
Predictive Analytics met netwerkgdata in R
Oefeninstructies
- Voeg een kolom
FromLabeltoe aan deedgeList-dataframe met het label van defrom-nodes doorcustomers$idte matchen metedgeList$fromencustomers$churnte extraheren. - Doe hetzelfde voor de
to-edges en noem deze kolomToLabel. - Voeg een kolom
edgeTypetoe aan deedgeList-dataframe die de som is van de kolommenFromLabelenToLabel. - Gebruik de functie
table()om het aantal van elk type edge te zien.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Add the column edgeList$FromLabel
edgeList$FromLabel <- customers[match(edgeList$___, customers$___), 2]
# Add the column edgeList$ToLabel
edgeList$ToLabel <- customers[___(___, ___), 2]
# Add the column edgeList$edgeType
edgeList$edgeType <- edgeList$___ + edgeList$___
# Count the number of each type of edge
___(edgeList$edgeType)