Crea índices de train/test personalizados
Como viste en el vídeo, en este capítulo te centrarás en un conjunto de datos real que reúne todos los conceptos tratados en los capítulos anteriores.
El conjunto de datos de churn contiene información de diversos clientes de telecomunicaciones y el reto de modelado es predecir qué clientes cancelarán su servicio (harán churn).
En este capítulo, explorarás dos tipos de modelos predictivos: glmnet y rf. Así que lo primero es crear un objeto trainControl reutilizable que te permita compararlos de forma fiable.
Este ejercicio forma parte del curso
Machine Learning con caret en R
Instrucciones del ejercicio
churn_x y churn_y están cargados en tu espacio de trabajo.
- Usa
createFolds()para crear 5 particiones de validación cruzada sobrechurn_y, tu variable objetivo en este ejercicio. - Pásalas a
trainControl()para crear untrainControlreutilizable para comparar modelos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create custom indices: myFolds
myFolds <- createFolds(___, k = 5)
# Create reusable trainControl object: myControl
myControl <- trainControl(
summaryFunction = twoClassSummary,
classProbs = TRUE, # IMPORTANT!
verboseIter = TRUE,
savePredictions = TRUE,
index = ___
)