Aan de slagGa gratis aan de slag

Maak aangepaste train/test-indexen

Zoals je in de video zag, focus je in dit hoofdstuk op een realistische gegevensset die alle concepten uit de vorige hoofdstukken samenbrengt.

De churn-gegevensset bevat data over allerlei telecomklanten. De modelleeruitdaging is om te voorspellen welke klanten hun abonnement opzeggen (churnen).

In dit hoofdstuk ga je twee soorten voorspellende modellen verkennen: glmnet en rf. De eerste stap is daarom het aanmaken van een herbruikbaar trainControl-object waarmee je ze betrouwbaar kunt vergelijken.

Deze oefening maakt deel uit van de cursus

Machine Learning met caret in R

Cursus bekijken

Oefeninstructies

churn_x en churn_y zijn geladen in je werkruimte.

  • Gebruik createFolds() om 5 CV-folds te maken op churn_y, je doelvariabele voor deze oefening.
  • Geef ze door aan trainControl() om een herbruikbare trainControl te maken voor het vergelijken van modellen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)

# Create reusable trainControl object: myControl
myControl <- trainControl(
  summaryFunction = twoClassSummary,
  classProbs = TRUE, # IMPORTANT!
  verboseIter = TRUE,
  savePredictions = TRUE,
  index = ___
)
Code bewerken en uitvoeren