Inferencia colectiva
La inferencia colectiva es un procedimiento para etiquetar simultáneamente nodos en datos interconectados y así reducir el error de clasificación.
En este ejercicio vas a realizar inferencia colectiva y ver el efecto que tiene en la predicción de churn usando la métrica AUC. AUC, o área bajo la curva ROC, se usa habitualmente para evaluar el rendimiento de técnicas de clasificación.
- AUC = probabilidad de que un churner elegido al azar quede por encima en el ranking del modelo que un no churner elegido al azar
- AUC = número entre 0.5 y 1, donde un valor más alto indica un mejor modelo
¿La inferencia colectiva aumenta el valor del AUC?
Este ejercicio forma parte del curso
Analítica predictiva con datos conectados en R
Instrucciones del ejercicio
- Calcula el AUC del clasificador de vecinos relacionales llamando a la función
aucdel paquetepROC, usando las etiquetas reales de churncustomers$churnychurnProbcomo valor predicho. - Escribe un bucle
foren el que apliques el clasificador probabilístico de vecinos relacionales diez veces y, en cada iteración, vuelve a asignar el valor al vectorchurnProb. - Calcula de nuevo el AUC usando el vector
churnProbactualizado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load the pROC package and data
library(pROC)
load("Nex132.RData")
# Compute the AUC
___(customers$churn, as.vector(churnProb))
# Write a for loop to update the probabilities
___(i in 1:10){
___ <- as.vector((AdjacencyMatrix %*% churnProb) / neighbors)
}
# Compute the AUC again
___(customers$churn, as.vector(___))