Özel train/test indisleri oluştur
Videoda gördüğün gibi, bu bölümde önceki bölümlerde tartışılan tüm kavramları bir araya getiren gerçek dünyadan bir veri kümesine odaklanacaksın.
Churn veri kümesi, çeşitli telekom müşterilerine ait veriler içerir ve modelleme görevi, hangi müşterilerin hizmetlerini iptal edeceğini (yani churn edeceğini) tahmin etmektir.
Bu bölümde iki farklı türde öngörücü modeli inceleyeceksin: glmnet ve rf. Bu yüzden ilk iş olarak, onları güvenilir biçimde karşılaştırmak için yeniden kullanılabilir bir trainControl nesnesi oluşturman gerekiyor.
Bu egzersiz
R ile caret kullanarak Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
churn_x ve churn_y çalışma alanına yüklendi.
- Bu egzersizdeki hedef değişkenin olan
churn_yüzerinde 5 katlı CV oluşturmak içincreateFolds()kullan. - Modelleri karşılaştırmak için yeniden kullanılabilir bir
trainControloluşturmak üzere bu fold'larıtrainControl()'a aktar.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)
# Create reusable trainControl object: myControl
myControl <- trainControl(
summaryFunction = twoClassSummary,
classProbs = TRUE, # IMPORTANT!
verboseIter = TRUE,
savePredictions = TRUE,
index = ___
)