ComenzarEmpieza gratis

Crea índices de train/test personalizados

Como viste en el vídeo, en este capítulo te centrarás en un conjunto de datos real que reúne todos los conceptos tratados en los capítulos anteriores.

El conjunto de datos de churn contiene información de diversos clientes de telecomunicaciones y el reto de modelado es predecir qué clientes cancelarán su servicio (harán churn).

En este capítulo, explorarás dos tipos de modelos predictivos: glmnet y rf. Así que lo primero es crear un objeto trainControl reutilizable que te permita compararlos de forma fiable.

Este ejercicio forma parte del curso

Machine Learning con caret en R

Ver curso

Instrucciones del ejercicio

churn_x y churn_y están cargados en tu espacio de trabajo.

  • Usa createFolds() para crear 5 particiones de validación cruzada sobre churn_y, tu variable objetivo en este ejercicio.
  • Pásalas a trainControl() para crear un trainControl reutilizable para comparar modelos.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)

# Create reusable trainControl object: myControl
myControl <- trainControl(
  summaryFunction = twoClassSummary,
  classProbs = TRUE, # IMPORTANT!
  verboseIter = TRUE,
  savePredictions = TRUE,
  index = ___
)
Editar y ejecutar código