Inferência Coletiva
Inferência coletiva é um procedimento para rotular simultaneamente nós em dados interconectados, reduzindo o erro de classificação.
Neste exercício, você vai realizar inferência coletiva e observar o efeito na predição de churn usando a métrica de desempenho AUC. A AUC, ou área sob a curva ROC, é comumente usada para avaliar o desempenho de técnicas de classificação.
- AUC = probabilidade de que um cliente churner escolhido aleatoriamente seja ranqueado mais alto pelo modelo do que um não churner escolhido aleatoriamente
- AUC = número entre 0.5 e 1, em que valores mais altos indicam um modelo melhor
A inferência coletiva aumenta o valor de AUC?
Este exercício faz parte do curso
Análise Preditiva com Dados em Rede em R
Instruções do exercício
- Calcule a AUC do classificador de vizinhos relacionais chamando a função
aucdo pacotepROC, usando os rótulos reais de churncustomers$churnechurnProbcomo valor previsto. - Escreva um loop
foraplicando o classificador probabilístico de vizinhos relacionais dez vezes e atribua novamente o valor ao vetorchurnProba cada iteração. - Calcule a AUC novamente usando o vetor
churnProbatualizado.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load the pROC package and data
library(pROC)
load("Nex132.RData")
# Compute the AUC
___(customers$churn, as.vector(churnProb))
# Write a for loop to update the probabilities
___(i in 1:10){
___ <- as.vector((AdjacencyMatrix %*% churnProb) / neighbors)
}
# Compute the AUC again
___(customers$churn, as.vector(___))