Crea indici train/test personalizzati
Come hai visto nel video, in questo capitolo ti concentrerai su un insieme di dati reale che riunisce tutti i concetti trattati nei capitoli precedenti.
Il dataset churn contiene dati su diversi clienti di un'azienda di telecomunicazioni e la sfida di modellazione è prevedere quali clienti cancelleranno il servizio (ovvero andranno in churn).
In questo capitolo esplorerai due tipi di modelli predittivi: glmnet e rf. Quindi il primo passo è creare un oggetto trainControl riutilizzabile che ti permetta di confrontarli in modo affidabile.
Questo esercizio fa parte del corso
Machine Learning con caret in R
Istruzioni dell'esercizio
churn_x e churn_y sono già caricati nel tuo workspace.
- Usa
createFolds()per creare 5 fold di CV suchurn_y, la variabile target di questo esercizio. - Passali a
trainControl()per creare untrainControlriutilizzabile con cui confrontare i modelli.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)
# Create reusable trainControl object: myControl
myControl <- trainControl(
summaryFunction = twoClassSummary,
classProbs = TRUE, # IMPORTANT!
verboseIter = TRUE,
savePredictions = TRUE,
index = ___
)