ComenzarEmpieza gratis

Inferencia colectiva

La inferencia colectiva es un procedimiento para etiquetar simultáneamente nodos en datos interconectados y así reducir el error de clasificación.

En este ejercicio vas a realizar inferencia colectiva y ver el efecto que tiene en la predicción de churn usando la métrica AUC. AUC, o área bajo la curva ROC, se usa habitualmente para evaluar el rendimiento de técnicas de clasificación.

  • AUC = probabilidad de que un churner elegido al azar quede por encima en el ranking del modelo que un no churner elegido al azar
  • AUC = número entre 0.5 y 1, donde un valor más alto indica un mejor modelo

¿La inferencia colectiva aumenta el valor del AUC?

Este ejercicio forma parte del curso

Analítica predictiva con datos conectados en R

Ver curso

Instrucciones del ejercicio

  • Calcula el AUC del clasificador de vecinos relacionales llamando a la función auc del paquete pROC, usando las etiquetas reales de churn customers$churn y churnProb como valor predicho.
  • Escribe un bucle for en el que apliques el clasificador probabilístico de vecinos relacionales diez veces y, en cada iteración, vuelve a asignar el valor al vector churnProb.
  • Calcula de nuevo el AUC usando el vector churnProb actualizado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load the pROC package and data
library(pROC)
load("Nex132.RData")

# Compute the AUC
___(customers$churn, as.vector(churnProb))

# Write a for loop to update the probabilities
___(i in 1:10){
 ___ <- as.vector((AdjacencyMatrix %*% churnProb) / neighbors)
}

# Compute the AUC again
___(customers$churn, as.vector(___))
Editar y ejecutar código