Criar índices personalizados de treino/teste
Como você viu no vídeo, neste capítulo você vai focar em um conjunto de dados real que reúne todos os conceitos discutidos nos capítulos anteriores.
O conjunto de dados de churn contém informações sobre diversos clientes de telecom, e o desafio de modelagem é prever quais clientes vão cancelar o serviço (ou churn).
Neste capítulo, você vai explorar dois tipos de modelos preditivos: glmnet e rf. Então, a primeira tarefa é criar um objeto trainControl reutilizável para comparar esses modelos de forma confiável.
Este exercício faz parte do curso
Machine Learning com caret em R
Instruções do exercício
churn_x e churn_y estão carregados no seu ambiente.
- Use
createFolds()para criar 5 folds de validação cruzada emchurn_y, sua variável-alvo neste exercício. - Passe esses folds para
trainControl()para criar umtrainControlreutilizável e comparar modelos.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)
# Create reusable trainControl object: myControl
myControl <- trainControl(
summaryFunction = twoClassSummary,
classProbs = TRUE, # IMPORTANT!
verboseIter = TRUE,
savePredictions = TRUE,
index = ___
)