Crea un modelo completo de random forest
Los modelos de random forest realizan selección de características de forma natural al construir muchos subárboles a partir de subconjuntos aleatorios de las variables. Una forma de entender las importancias de las características es crear un modelo y después extraer dichas importancias. Así que, en este ejercicio, usarás los datos de rotación de personal en Healthcare para entrenar un modelo de clasificación rand_forest() del que podrás extraer las importancias de las características. Para que las importancias estén disponibles, asegúrate de crear el modelo con importance = "impurity". Tienes disponibles los conjuntos train y test.
Los paquetes tidyverse, tidymodels y vip ya se han cargado por ti.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Define un modelo de clasificación de random forest con 200 árboles que te permita extraer importancias de características.
- Ajusta el modelo de random forest con todos los predictores.
- Vincula las predicciones con el conjunto de prueba.
- Calcula la métrica F1.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Specify the random forest model
rf_spec <- ___(mode = "___", ___ = ___) %>%
set_engine("___", ___ = "___")
# Fit the random forest model with all predictors
rf_fit <- ___ %>%
___(___, data = ___)
# Create the test set prediction data frame
predict_df <- ___ %>%
bind_cols(predict = ___(___, ___))
# Calculate F1 performance
f_meas(predict_df, ___, .pred_class)