Pertukaran kecepatan–akurasi
Dalam video terakhir, Anda melihat ada dua kenop yang dapat Anda atur untuk memengaruhi kinerja random forests:
- Jumlah pohon keputusan dalam setiap hutan.
- Jumlah variabel yang digunakan untuk pemisahan di dalam pohon keputusan.
Meningkatkan masing-masing dapat memperbaiki akurasi model imputasi, tetapi juga akan membutuhkan waktu komputasi yang lebih lama. Pada latihan ini, Anda akan mengeksplorasi gagasan tersebut dengan menjalankan missForest() pada data biopics dua kali dengan pengaturan yang berbeda. Saat mengikuti instruksi, perhatikan galat yang akan Anda cetak dan waktu yang dibutuhkan kode untuk berjalan.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set number of trees to 5 and number of variables used for splitting to 2
imp_res <- missForest(biopics, ___ = ___, ___ = ___)
# Print the resulting imputation errors
print(___)