Maak een aangepaste trainControl
De wijnkwaliteitsgegevensset was een regressieprobleem, maar nu kijk je naar een classificatieprobleem. Dit is een gesimuleerde gegevensset gebaseerd op de "don't overfit"-competitie op Kaggle van een aantal jaar geleden.
Classificatieproblemen zijn wat ingewikkelder dan regressieproblemen, omdat je een aangepaste summaryFunction aan de train()-functie moet meegeven om de AUC-maatstaf te gebruiken om je modellen te rangschikken. Begin met het maken van een aangepaste trainControl, zoals je in het vorige hoofdstuk deed. Zorg ervoor dat je classProbs = TRUE instelt, anders werkt twoClassSummary voor summaryFunction niet.
Deze oefening maakt deel uit van de cursus
Machine Learning met caret in R
Oefeninstructies
Maak een aangepaste trainControl met de naam myControl voor classificatie met de functie trainControl.
- Gebruik 10 CV-folds.
- Gebruik
twoClassSummaryvoor desummaryFunction. - Zorg ervoor dat je
classProbs = TRUEinstelt.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create custom trainControl: myControl
myControl <- trainControl(
method = "cv",
number = ___,
summaryFunction = ___,
classProbs = ___, # IMPORTANT!
verboseIter = TRUE
)