Plot kurva ROC
Anda kembali melihat bahwa boosted tree menghasilkan AUC tertinggi. Angka itu bagus, tetapi visualisasi lebih informatif! Mengapa tidak memvisualisasikan hasil ini?
Anda akan menggambarkan kinerja model dengan memplot semua kurva ROC dalam satu grafik. Karena AUC secara harfiah adalah luas di bawah kurva ROC, model boosted seharusnya memiliki luas terbesar di bawah kurva ROC-nya dan berada di sudut kiri atas grafik.
Tibble prediksi, preds_combined, masih dimuat.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Bentukkan ulang tibble
preds_combinedsehingga semua kolom yang diawali"preds_"menjadi baris, bukan kolom. Ubah nama kolom tersebut menjadi kolom"model"dan nilainya menjadi kolom bernama"predictions". - Kelompokkan hasil berdasarkan
model. - Hitung nilai ROC untuk semua cutoff.
- Hasilkan visualisasi grafik dari kurva-kurva tersebut.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Reshape the predictions into long format
predictions_long <- tidyr::pivot_longer(___,
cols = starts_with("___"),
names_to = "___",
values_to = "___")
predictions_long %>%
# Group by model
___(___) %>%
# Calculate values for every cutoff
___(truth = ___,
estimate = ___) %>%
# Create a plot from the calculated data
___()