Inférence collective
L’inférence collective est une procédure qui consiste à étiqueter simultanément les nœuds dans des données interconnectées afin de réduire l’erreur de classification.
Dans cet exercice, vous allez appliquer l’inférence collective et observer son impact sur la prédiction du churn à l’aide de la mesure de performance AUC. L’AUC, ou aire sous la courbe ROC, est couramment utilisée pour évaluer les performances des techniques de classification.
- AUC = probabilité qu’un client churner choisi au hasard soit classé plus haut par le modèle qu’un non-churner choisi au hasard
- AUC = nombre compris entre 0,5 et 1, une valeur plus élevée indiquant un meilleur modèle
L’inférence collective augmente-t-elle la valeur de l’AUC ?
Cet exercice fait partie du cours
Analytique prédictive avec des données en réseau sous R
Instructions
- Calculez l’AUC du classificateur de voisins relationnels en appelant la fonction
aucdu packagepROC, en utilisant les étiquettes réelles de churncustomers$churnetchurnProbcomme valeur prédite. - Écrivez une boucle
forqui applique dix fois le classificateur probabiliste de voisins relationnels, et réaffecte à chaque itération la valeur au vecteurchurnProb. - Recalculez l’AUC en utilisant le vecteur
churnProbmis à jour.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the pROC package and data
library(pROC)
load("Nex132.RData")
# Compute the AUC
___(customers$churn, as.vector(churnProb))
# Write a for loop to update the probabilities
___(i in 1:10){
___ <- as.vector((AdjacencyMatrix %*% churnProb) / neighbors)
}
# Compute the AUC again
___(customers$churn, as.vector(___))