Sıfırdan zirveye
Bir model belirtimi oluşturma ve veriyi eğitim ve test kümelerine ayırma becerilerini öğrendin. Ayrıca bölmede sınıf dengesizliklerinden nasıl kaçınacağını da biliyorsun. Şimdi, önceki derste öğrendiklerini birleştirmenin ve modelini yalnızca eğitim kümesini kullanarak oluşturmanın zamanı!
Artık düzgün bir machine learning pipeline kuracaksın. Bu; bir model belirtimi oluşturmayı, verini eğitim ve test kümelerine ayırmayı ve son olarak da eğitim verisini bir modele uydurmayı içerir. Keyfini çıkar!
Bu egzersiz
R ile Ağaç Tabanlı Modellerle Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Eğitim kümesinin
diabetessatırlarının dörtte üçünü içerdiği ve eğitim ile test kümelerininoutcomedeğişkeninde benzer bir dağılıma sahip olduğu bir bölünme olandiabetes_splitoluştur. - Modelin için
rpartmotorunu kullanan bir karar ağacı belirtimi oluştur ve bunutree_specolarak kaydet. outcomehedef değişkeni vebmiileskin_thicknessyordayıcılarıyla,diabetes_split'in eğitim verilerini kullanarakmodel_trainedadlı bir model uydur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
set.seed(9)
# Create the balanced data split
diabetes_split <- ___
# Build the specification of the model
tree_spec <- ___ %>%
___ %>%
___
# Train the model
model_trained <- ___ %>%
fit(___,
___)
model_trained