Aan de slagBegin gratis

Maak aangepaste train/test-indexen

Zoals je in de video zag, focus je in dit hoofdstuk op een realistische gegevensset die alle concepten uit de vorige hoofdstukken samenbrengt.

De churn-gegevensset bevat data over allerlei telecomklanten. De modelleeruitdaging is om te voorspellen welke klanten hun abonnement opzeggen (churnen).

In dit hoofdstuk ga je twee soorten voorspellende modellen verkennen: glmnet en rf. De eerste stap is daarom het aanmaken van een herbruikbaar trainControl-object waarmee je ze betrouwbaar kunt vergelijken.

Deze oefening maakt deel uit van de cursus

Machine Learning met caret in R

Bekijk cursus

Oefeninstructies

churn_x en churn_y zijn geladen in je werkruimte.

  • Gebruik createFolds() om 5 CV-folds te maken op churn_y, je doelvariabele voor deze oefening.
  • Geef ze door aan trainControl() om een herbruikbare trainControl te maken voor het vergelijken van modellen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)

# Create reusable trainControl object: myControl
myControl <- trainControl(
  summaryFunction = twoClassSummary,
  classProbs = TRUE, # IMPORTANT!
  verboseIter = TRUE,
  savePredictions = TRUE,
  index = ___
)
Code bewerken en uitvoeren