Aan de slagGa gratis aan de slag

Typen edges extraheren

In deze oefening koppel je de klant-ID’s in de customer-dataframe aan de klant-edgelist om te bepalen of elke edge een churn-, non-churn- of gemengde edge is. Met de functie match() voeg je twee kolommen toe aan de edgelist.

  1. fromLabel met de churnstatus van de from-kolom
  2. toLabel met de churnstatus van de to-kolom

Het commando match(x, y) geeft een vector terug met de positie van x in y. In de bovenstaande figuur is match(edgeList$from, customers$id) 1,1,1,2,2. Bijvoorbeeld: de vierde regel in edgeList$from, de klant met id 393, is het tweede element in customers$id. Het churnlabel van deze klant is daarom customers[2,2] of 0. Op dezelfde manier is het churnlabel van iedereen in edgeList$from customers[match(edgeList$from, customers$id),2].

Deze oefening maakt deel uit van de cursus

Predictive Analytics met netwerkgdata in R

Cursus bekijken

Oefeninstructies

  • Voeg een kolom FromLabel toe aan de edgeList-dataframe met het label van de from-nodes door customers$id te matchen met edgeList$from en customers$churn te extraheren.
  • Doe hetzelfde voor de to-edges en noem deze kolom ToLabel.
  • Voeg een kolom edgeType toe aan de edgeList-dataframe die de som is van de kolommen FromLabel en ToLabel.
  • Gebruik de functie table() om het aantal van elk type edge te zien.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Add the column edgeList$FromLabel
edgeList$FromLabel <- customers[match(edgeList$___, customers$___), 2]
 
# Add the column edgeList$ToLabel
edgeList$ToLabel <- customers[___(___, ___), 2]
 
# Add the column edgeList$edgeType
edgeList$edgeType <- edgeList$___ + edgeList$___
 
# Count the number of each type of edge
___(edgeList$edgeType)
Code bewerken en uitvoeren