Aan de slagGa gratis aan de slag

Maak een aangepaste trainControl

De wijnkwaliteitsgegevensset was een regressieprobleem, maar nu kijk je naar een classificatieprobleem. Dit is een gesimuleerde gegevensset gebaseerd op de "don't overfit"-competitie op Kaggle van een aantal jaar geleden.

Classificatieproblemen zijn wat ingewikkelder dan regressieproblemen, omdat je een aangepaste summaryFunction aan de train()-functie moet meegeven om de AUC-maatstaf te gebruiken om je modellen te rangschikken. Begin met het maken van een aangepaste trainControl, zoals je in het vorige hoofdstuk deed. Zorg ervoor dat je classProbs = TRUE instelt, anders werkt twoClassSummary voor summaryFunction niet.

Deze oefening maakt deel uit van de cursus

Machine Learning met caret in R

Cursus bekijken

Oefeninstructies

Maak een aangepaste trainControl met de naam myControl voor classificatie met de functie trainControl.

  • Gebruik 10 CV-folds.
  • Gebruik twoClassSummary voor de summaryFunction.
  • Zorg ervoor dat je classProbs = TRUE instelt.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create custom trainControl: myControl
myControl <- trainControl(
  method = "cv", 
  number = ___,
  summaryFunction = ___,
  classProbs = ___, # IMPORTANT!
  verboseIter = TRUE
)
Code bewerken en uitvoeren