Crea un modelo completo de random forest

Los modelos de random forest realizan selección de características de forma natural al construir muchos subárboles a partir de subconjuntos aleatorios de las variables. Una forma de entender las importancias de las características es crear un modelo y después extraer dichas importancias. Así que, en este ejercicio, usarás los datos de rotación de personal en Healthcare para entrenar un modelo de clasificación rand_forest() del que podrás extraer las importancias de las características. Para que las importancias estén disponibles, asegúrate de crear el modelo con importance = "impurity". Tienes disponibles los conjuntos train y test.

Los paquetes tidyverse, tidymodels y vip ya se han cargado por ti.

Este ejercicio forma parte del curso

Reducción de la dimensionalidad en R

Ver curso

Instrucciones del ejercicio

Define un modelo de clasificación de random forest con 200 árboles que te permita extraer importancias de características.
Ajusta el modelo de random forest con todos los predictores.
Vincula las predicciones con el conjunto de prueba.
Calcula la métrica F1.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Specify the random forest model
rf_spec <- ___(mode = "___", ___ = ___) %>% 
  set_engine("___", ___ = "___") 

# Fit the random forest model with all predictors
rf_fit <- ___ %>% 
  ___(___, data = ___)

# Create the test set prediction data frame
predict_df <- ___ %>% 
  bind_cols(predict = ___(___, ___))

# Calculate F1 performance
f_meas(predict_df, ___, .pred_class)

Editar y ejecutar código