MulaiMulai sekarang secara gratis

Latih model tersebut

Spesifikasi model adalah awal yang baik, layaknya kanvas bagi seorang pelukis. Namun seperti pelukis membutuhkan warna, spesifikasi membutuhkan data. Hanya model akhir yang mampu membuat prediksi:

Spesifikasi model + data = model

Dalam latihan ini, Anda akan melatih decision tree yang memodelkan risiko diabetes menggunakan variabel kesehatan sebagai prediktor. Variabel respons, outcome, menunjukkan apakah pasien mengidap diabetes atau tidak, sehingga ini adalah masalah klasifikasi biner (hanya ada dua kelas). Himpunan data juga memuat variabel kesehatan pasien seperti blood_pressure, age, dan bmi.

Untuk sisa kursus ini, paket tidymodels selalu akan dimuat sebelumnya. Pada latihan ini, himpunan data diabetes juga tersedia di ruang kerja Anda.

Latihan ini adalah bagian dari kursus

Machine Learning dengan Model Berbasis Pohon di R

Lihat Kursus

Petunjuk latihan

  • Buat tree_spec, yaitu spesifikasi untuk decision tree dengan engine rpart.
  • Latih model tree_model_bmi, di mana outcome hanya bergantung pada prediktor bmi dengan melakukan fitting himpunan data diabetes ke spesifikasi tersebut.
  • Cetak model ke konsol.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create the specification
tree_spec <- ___() %>% 
  ___("rpart") %>% 
  ___

# Train the model
tree_model_bmi <- tree_spec %>% 
  ___

# Print the model
___
Edit dan Jalankan Kode