Maak aangepaste train/test-indexen
Zoals je in de video zag, focus je in dit hoofdstuk op een realistische gegevensset die alle concepten uit de vorige hoofdstukken samenbrengt.
De churn-gegevensset bevat data over allerlei telecomklanten. De modelleeruitdaging is om te voorspellen welke klanten hun abonnement opzeggen (churnen).
In dit hoofdstuk ga je twee soorten voorspellende modellen verkennen: glmnet en rf. De eerste stap is daarom het aanmaken van een herbruikbaar trainControl-object waarmee je ze betrouwbaar kunt vergelijken.
Deze oefening maakt deel uit van de cursus
Machine Learning met caret in R
Oefeninstructies
churn_x en churn_y zijn geladen in je werkruimte.
- Gebruik
createFolds()om 5 CV-folds te maken opchurn_y, je doelvariabele voor deze oefening. - Geef ze door aan
trainControl()om een herbruikbaretrainControlte maken voor het vergelijken van modellen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)
# Create reusable trainControl object: myControl
myControl <- trainControl(
summaryFunction = twoClassSummary,
classProbs = TRUE, # IMPORTANT!
verboseIter = TRUE,
savePredictions = TRUE,
index = ___
)