Erstelle ein eigenes trainControl
Der Datensatz zur Weinqualität war ein Regressionsproblem, jetzt geht es um ein Klassifikationsproblem. Dies ist ein simulierter Datensatz, der auf dem "don't overfit"-Wettbewerb auf Kaggle von vor einigen Jahren basiert.
Klassifikationsprobleme sind etwas komplizierter als Regressionsprobleme, da du der Funktion train() eine eigene summaryFunction geben musst, um die Kennzahl AUC zur Bewertung deiner Modelle zu verwenden. Starte damit, ein eigenes trainControl zu erstellen, so wie im vorherigen Kapitel. Achte darauf, classProbs = TRUE zu setzen, sonst funktioniert twoClassSummary als summaryFunction nicht.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit caret in R
Anleitung zur Übung
Erstelle mit der Funktion trainControl ein eigenes trainControl namens myControl für Klassifikation.
- Verwende 10 CV-Folds.
- Verwende
twoClassSummaryalssummaryFunction. - Setze unbedingt
classProbs = TRUE.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create custom trainControl: myControl
myControl <- trainControl(
method = "cv",
number = ___,
summaryFunction = ___,
classProbs = ___, # IMPORTANT!
verboseIter = TRUE
)