Eigene Train/Test-Indizes erstellen
Wie du im Video gesehen hast, konzentrierst du dich in diesem Kapitel auf einen realen Datensatz, der alle Konzepte aus den vorherigen Kapiteln zusammenführt.
Der Churn-Datensatz enthält Daten zu verschiedenen Telekommunikationskund:innen. Die Modellierungsaufgabe besteht darin, vorherzusagen, welche Kund:innen ihren Vertrag kündigen (also churnen).
In diesem Kapitel untersuchst du zwei unterschiedliche Arten von Vorhersagemodellen: glmnet und rf. Der erste Schritt ist daher, ein wiederverwendbares trainControl-Objekt zu erstellen, mit dem du sie zuverlässig vergleichen kannst.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit caret in R
Anleitung zur Übung
churn_x und churn_y sind in deinem Workspace geladen.
- Verwende
createFolds(), um 5 CV-Folds aufchurn_yzu erzeugen, deiner Zielvariable für diese Übung. - Übergebe diese an
trainControl(), um ein wiederverwendbarestrainControlzum Vergleichen von Modellen zu erstellen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)
# Create reusable trainControl object: myControl
myControl <- trainControl(
summaryFunction = twoClassSummary,
classProbs = TRUE, # IMPORTANT!
verboseIter = TRUE,
savePredictions = TRUE,
index = ___
)