Collective Inferencing
Collective Inferencing ist ein Verfahren, um Knoten in vernetzten Daten gleichzeitig zu labeln und so den Klassifikationsfehler zu reduzieren.
In dieser Übung führst du Collective Inferencing durch und siehst den Effekt auf die Churn-Vorhersage anhand des Leistungsmaßes AUC. AUC, die Fläche unter der ROC-Kurve, wird häufig verwendet, um die Leistung von Klassifikationsverfahren zu beurteilen.
- AUC = Wahrscheinlichkeit, dass ein zufällig gewählter Churner vom Modell höher eingestuft wird als ein zufällig gewählter Nicht-Churner
- AUC = Zahl zwischen 0,5 und 1; je höher, desto besser das Modell
Erhöht Collective Inferencing den AUC-Wert?
Diese Übung ist Teil des Kurses
Predictive Analytics mit vernetzten Daten in R
Anleitung zur Übung
- Berechne die AUC des relational neighbor classifier, indem du die Funktion
aucaus dem PaketpROCmit den tatsächlichen Churn-Labelscustomers$churnundchurnProbals vorhergesagtem Wert aufrufst. - Schreibe eine
for-Schleife, in der du den probabilistic relational neighbor classifier zehnmal anwendest und in jeder Iteration den Wert wieder dem VektorchurnProbzuweist. - Berechne die AUC erneut mit dem aktualisierten Vektor
churnProb.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load the pROC package and data
library(pROC)
load("Nex132.RData")
# Compute the AUC
___(customers$churn, as.vector(churnProb))
# Write a for loop to update the probabilities
___(i in 1:10){
___ <- as.vector((AdjacencyMatrix %*% churnProb) / neighbors)
}
# Compute the AUC again
___(customers$churn, as.vector(___))