Latih model tersebut
Spesifikasi model adalah awal yang baik, layaknya kanvas bagi seorang pelukis. Namun seperti pelukis membutuhkan warna, spesifikasi membutuhkan data. Hanya model akhir yang mampu membuat prediksi:
Spesifikasi model + data = model
Dalam latihan ini, Anda akan melatih decision tree yang memodelkan risiko diabetes menggunakan variabel kesehatan sebagai prediktor. Variabel respons, outcome, menunjukkan apakah pasien mengidap diabetes atau tidak, sehingga ini adalah masalah klasifikasi biner (hanya ada dua kelas). Himpunan data juga memuat variabel kesehatan pasien seperti blood_pressure, age, dan bmi.
Untuk sisa kursus ini, paket tidymodels selalu akan dimuat sebelumnya. Pada latihan ini, himpunan data diabetes juga tersedia di ruang kerja Anda.
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Buat
tree_spec, yaitu spesifikasi untuk decision tree dengan enginerpart. - Latih model
tree_model_bmi, di manaoutcomehanya bergantung pada prediktorbmidengan melakukan fitting himpunan datadiabeteske spesifikasi tersebut. - Cetak model ke konsol.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the specification
tree_spec <- ___() %>%
___("rpart") %>%
___
# Train the model
tree_model_bmi <- tree_spec %>%
___
# Print the model
___