Modelo de random forest
En este ejercicio, usarás la función randomForest() del paquete randomForest para crear un modelo de random forest que prediga el churn de los clientes en el conjunto de entrenamiento, training_set. La variable objetivo se llama Future.
También inspeccionarás y visualizarás la importancia de las variables en el modelo.
Este ejercicio forma parte del curso
Analítica predictiva con datos conectados en R
Instrucciones del ejercicio
- Carga el paquete
randomForest. - Usa la función
set.seed()con la semilla 863. - Construye un random forest con la función
randomForest()y todas las variables detraining_set. La variable respuestaFuturedebe ser un factor, así que utiliza la funciónas.factor(). - Dibuja la importancia de variables del modelo de random forest con
varImpPlot().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load package
___(randomForest)
# Set seed
set.seed(___)
# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)
# Plot variable importance
varImpPlot(___)