Pertukaran kecepatan–akurasi
Dalam video terakhir, Anda melihat ada dua kenop yang dapat Anda atur untuk memengaruhi kinerja random forests:
- Jumlah pohon keputusan dalam setiap hutan.
- Jumlah variabel yang digunakan untuk pemisahan di dalam pohon keputusan.
Meningkatkan masing-masing dapat memperbaiki akurasi model imputasi, tetapi juga akan membutuhkan waktu komputasi yang lebih lama. Pada latihan ini, Anda akan mengeksplorasi gagasan tersebut dengan menjalankan missForest() pada data biopics dua kali dengan pengaturan yang berbeda. Saat mengikuti instruksi, perhatikan galat yang akan Anda cetak dan waktu yang dibutuhkan kode untuk berjalan.
Latihan ini merupakan bagian dari kursus
Menangani Data Hilang dengan Imputasi di R
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Set number of trees to 5 and number of variables used for splitting to 2
imp_res <- missForest(biopics, ___ = ___, ___ = ___)
# Print the resulting imputation errors
print(___)