Dari nol jadi andal
Anda telah menguasai keterampilan membuat spesifikasi model dan membagi himpunan data menjadi data pelatihan dan uji. Anda juga tahu cara menghindari ketidakseimbangan kelas saat melakukan split. Sekarang saatnya menggabungkan apa yang Anda pelajari di pelajaran sebelumnya dan membangun model hanya dengan menggunakan data pelatihan!
Anda akan membangun sebuah machine learning pipeline yang lengkap. Ini mencakup pembuatan spesifikasi model, membagi data Anda menjadi himpunan pelatihan dan uji, dan terakhir, melatih data pelatihan ke model. Selamat mencoba!
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Buat
diabetes_split, sebuah split di mana himpunan pelatihan berisi tiga perempat dari semua barisdiabetesdan di mana himpunan pelatihan serta uji memiliki sebaran yang serupa pada variabeloutcome. - Bangun spesifikasi pohon keputusan untuk model Anda menggunakan engine
rpartdan simpan sebagaitree_spec. - Latih sebuah model
model_trainedmenggunakan data pelatihan daridiabetes_splitdenganoutcomesebagai variabel target danbmisertaskin_thicknesssebagai prediktor.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
set.seed(9)
# Create the balanced data split
diabetes_split <- ___
# Build the specification of the model
tree_spec <- ___ %>%
___ %>%
___
# Train the model
model_trained <- ___ %>%
fit(___,
___)
model_trained