Vollständiges Random-Forest-Modell erstellen

Random-Forest-Modelle führen von Natur aus eine Merkmalsauswahl durch, da sie viele Teilbäume aus zufälligen Teilmengen der Merkmale aufbauen. Eine Möglichkeit, Merkmalswichtigkeiten zu verstehen, ist, ein Modell zu erstellen und dann die Wichtigkeiten zu extrahieren. In dieser Übung trainierst du daher mit den Healthcare-Job-Attrition-Daten ein rand_forest()-Klassifikationsmodell, aus dem du Merkmalswichtigkeiten extrahieren kannst. Damit die Merkmalswichtigkeiten verfügbar sind, erstelle das Modell mit importance = "impurity". Die train- und test-Sets stehen dir zur Verfügung.

Die Pakete tidyverse, tidymodels und vip wurden für dich geladen.

Diese Übung ist Teil des Kurses

<Kurs>Dimensionsreduktion in R</Kurs>

Kurs ansehen

Übungsanweisungen

Definiere ein Random-Forest-Klassifikationsmodell mit 200 Bäumen, aus dem du Merkmalswichtigkeiten extrahieren kannst.
Fitte das Random-Forest-Modell mit allen Prädiktoren.
Binde die Vorhersagen an den Testdatensatz.
Berechne die F1-Kennzahl.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Specify the random forest model
rf_spec <- ___(mode = "___", ___ = ___) %>% 
  set_engine("___", ___ = "___") 

# Fit the random forest model with all predictors
rf_fit <- ___ %>% 
  ___(___, data = ___)

# Create the test set prediction data frame
predict_df <- ___ %>% 
  bind_cols(predict = ___(___, ___))

# Calculate F1 performance
f_meas(predict_df, ___, .pred_class)

Code bearbeiten und ausführen