ROC dan AUC dalam-sampel
Seberapa baik bagged tree menangkap struktur himpunan latih Anda? Apakah lebih baik daripada decision tree? Apakah modelnya overfit? Menggunakan ROC dan AUC adalah cara yang sangat baik untuk menilainya.
Dalam latihan ini, Anda akan membuat prediksi dalam-sampel tersebut dan menghitung ROC serta AUC-nya. Perhatikan baik-baik, akan ada kejutan!
Telah dimuat sebelumnya hasil dari latihan sebelumnya, model_bagged, dan data latih, customers_train.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Gunakan
model_baggeduntuk menghasilkan prediksi probabilitas dengan himpunan latih Anda dan tambahkan ke tibble data latih, simpan hasilnya sebagaipredictions. - Buat kurva ROC dari tibble
predictionsdan plot hasilnya. - Hitung AUC dari tibble
predictions.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Predict on training set and add to training set
predictions <- ___(___,
new_data = ___,
type = "___") %>%
bind_cols(___)
# Create and plot the ROC curve
roc_curve(___,
estimate = ___,
truth = ___) %>% autoplot()
# Calculate the AUC
___(predictions,
estimate = ___,
truth = ___)