ComenzarEmpieza gratis

Crea un modelo completo de random forest

Los modelos de random forest realizan selección de características de forma natural al construir muchos subárboles a partir de subconjuntos aleatorios de las variables. Una forma de entender las importancias de las características es crear un modelo y después extraer dichas importancias. Así que, en este ejercicio, usarás los datos de rotación de personal en Healthcare para entrenar un modelo de clasificación rand_forest() del que podrás extraer las importancias de las características. Para que las importancias estén disponibles, asegúrate de crear el modelo con importance = "impurity". Tienes disponibles los conjuntos train y test.

Los paquetes tidyverse, tidymodels y vip ya se han cargado por ti.

Este ejercicio forma parte del curso

Reducción de la dimensionalidad en R

Ver curso

Instrucciones del ejercicio

  • Define un modelo de clasificación de random forest con 200 árboles que te permita extraer importancias de características.
  • Ajusta el modelo de random forest con todos los predictores.
  • Vincula las predicciones con el conjunto de prueba.
  • Calcula la métrica F1.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Specify the random forest model
rf_spec <- ___(mode = "___", ___ = ___) %>% 
  set_engine("___", ___ = "___") 

# Fit the random forest model with all predictors
rf_fit <- ___ %>% 
  ___(___, data = ___)

# Create the test set prediction data frame
predict_df <- ___ %>% 
  bind_cols(predict = ___(___, ___))

# Calculate F1 performance
f_meas(predict_df, ___, .pred_class)
Editar y ejecutar código