ComeçarComece de graça

Criar índices personalizados de treino/teste

Como você viu no vídeo, neste capítulo você vai focar em um conjunto de dados real que reúne todos os conceitos discutidos nos capítulos anteriores.

O conjunto de dados de churn contém informações sobre diversos clientes de telecom, e o desafio de modelagem é prever quais clientes vão cancelar o serviço (ou churn).

Neste capítulo, você vai explorar dois tipos de modelos preditivos: glmnet e rf. Então, a primeira tarefa é criar um objeto trainControl reutilizável para comparar esses modelos de forma confiável.

Este exercício faz parte do curso

Machine Learning com caret em R

Ver curso

Instruções do exercício

churn_x e churn_y estão carregados no seu ambiente.

  • Use createFolds() para criar 5 folds de validação cruzada em churn_y, sua variável-alvo neste exercício.
  • Passe esses folds para trainControl() para criar um trainControl reutilizável e comparar modelos.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)

# Create reusable trainControl object: myControl
myControl <- trainControl(
  summaryFunction = twoClassSummary,
  classProbs = TRUE, # IMPORTANT!
  verboseIter = TRUE,
  savePredictions = TRUE,
  index = ___
)
Editar e executar o código