Inferensi Kolektif
Inferensi kolektif adalah prosedur untuk melabeli node secara simultan pada data yang saling terhubung guna menurunkan galat klasifikasi.
Dalam latihan ini, Anda akan melakukan inferensi kolektif dan melihat dampaknya terhadap prediksi churn menggunakan ukuran kinerja AUC. AUC, atau area di bawah kurva ROC, umum digunakan untuk menilai kinerja teknik klasifikasi.
- AUC = probabilitas bahwa churner yang dipilih secara acak diperingkat lebih tinggi oleh model dibandingkan non-churner yang dipilih secara acak
- AUC = angka antara 0,5 dan 1, di mana angka yang lebih tinggi berarti model lebih baik
Apakah inferensi kolektif meningkatkan nilai AUC?
Latihan ini adalah bagian dari kursus
Analitik Prediktif menggunakan Data Berjejaring di R
Petunjuk latihan
- Hitung AUC dari relational neighbor classifier dengan memanggil fungsi
aucdari paketpROC, menggunakan label churn aktualcustomers$churndanchurnProbsebagai nilai prediksi. - Tulis
forloop yang menerapkan probabilistic relational neighbor classifier sebanyak sepuluh kali, dan setiap iterasi menugaskan kembali nilainya ke vektorchurnProb. - Hitung kembali AUC menggunakan vektor
churnProbyang telah diperbarui.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the pROC package and data
library(pROC)
load("Nex132.RData")
# Compute the AUC
___(customers$churn, as.vector(churnProb))
# Write a for loop to update the probabilities
___(i in 1:10){
___ <- as.vector((AdjacencyMatrix %*% churnProb) / neighbors)
}
# Compute the AUC again
___(customers$churn, as.vector(___))