Einen Random Forest fitten
Wie du im Video gesehen hast, sind Random-Forest-Modelle deutlich flexibler als lineare Modelle. Sie können komplexe nichtlineare Effekte modellieren und automatisch Interaktionen zwischen Variablen erfassen. Auf realen Datensätzen liefern sie häufig sehr gute Ergebnisse. Probieren wir das am Wine-Quality-Datensatz aus. Ziel ist es, die von Menschen beurteilte Qualität eines Weins vorherzusagen, gegeben einige maschinell gemessene chemische und physikalische Eigenschaften der Charge.
Das Fitting eines Random-Forest-Modells funktioniert genauso wie das einer generalisierten linearen Regression, wie du im vorherigen Kapitel gemacht hast. Du änderst lediglich das Argument method in der Funktion train auf "ranger". Das Paket ranger ist eine Neufassung von Rs klassischem Paket randomForest, passt Modelle viel schneller an und liefert nahezu identische Ergebnisse. Wir empfehlen allen Einsteigerinnen und Einsteigern, für Random-Forest-Modellierung das Paket ranger zu verwenden.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit caret in R
Anleitung zur Übung
- Trainiere einen Random Forest namens
modelauf dem Wine-Quality-Datensatzwine, sodassqualitydie Zielvariable ist und alle anderen Variablen als erklärende Variablen dienen. - Verwende
method = "ranger". - Verwende eine
tuneLengthvon 1. - Verwende 5 CV-Folds.
- Gib
modelin der Konsole aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit random forest: model
model <- train(
___,
tuneLength = ___,
data = ___,
method = ___,
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console