MulaiMulai sekarang secara gratis

Dari nol jadi andal

Anda telah menguasai keterampilan membuat spesifikasi model dan membagi himpunan data menjadi data pelatihan dan uji. Anda juga tahu cara menghindari ketidakseimbangan kelas saat melakukan split. Sekarang saatnya menggabungkan apa yang Anda pelajari di pelajaran sebelumnya dan membangun model hanya dengan menggunakan data pelatihan!

Anda akan membangun sebuah machine learning pipeline yang lengkap. Ini mencakup pembuatan spesifikasi model, membagi data Anda menjadi himpunan pelatihan dan uji, dan terakhir, melatih data pelatihan ke model. Selamat mencoba!

Latihan ini adalah bagian dari kursus

Machine Learning dengan Model Berbasis Pohon di R

Lihat Kursus

Petunjuk latihan

  • Buat diabetes_split, sebuah split di mana himpunan pelatihan berisi tiga perempat dari semua baris diabetes dan di mana himpunan pelatihan serta uji memiliki sebaran yang serupa pada variabel outcome.
  • Bangun spesifikasi pohon keputusan untuk model Anda menggunakan engine rpart dan simpan sebagai tree_spec.
  • Latih sebuah model model_trained menggunakan data pelatihan dari diabetes_split dengan outcome sebagai variabel target dan bmi serta skin_thickness sebagai prediktor.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

set.seed(9)

# Create the balanced data split
diabetes_split <- ___

# Build the specification of the model
tree_spec <- ___ %>% 
  ___ %>% 
  ___

# Train the model
model_trained <- ___ %>% 
  fit(___, 
      ___)

model_trained
Edit dan Jalankan Kode