Training mit Bootstrapping

Baue nun einen „schwachen“ Decision-Tree-Klassifikator und trainiere ihn auf einer Stichprobe des Trainingssatzes, die mit Zurücklegen gezogen wurde. So verstehst du, was bei jeder Iteration eines Bagging-Ensembles passiert.

Zum Ziehen einer Stichprobe verwendest du die pandas-Methode .sample(), die einen Parameter replace hat. Zum Beispiel zieht die folgende Codezeile mit Zurücklegen aus dem gesamten DataFrame df:

df.sample(frac=1.0, replace=True, random_state=42)

Diese Übung ist Teil des Kurses

Ensemble-Methoden in Python

Kurs anzeigen

Anleitung zur Übung

Ziehe eine Stichprobe mit Zurücklegen (replace=True) aus dem gesamten (frac=1.0) Trainingssatz X_train.
Baue einen Decision-Tree-Klassifikator mit dem Parameter max_depth = 4.
Fitte das Modell auf die gezogenen Trainingsdaten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Take a sample with replacement
X_train_sample = X_train.____(____, ____, random_state=42)
y_train_sample = y_train.loc[X_train_sample.index]

# Build a "weak" Decision Tree classifier
clf = ____(____, random_state=500)

# Fit the model to the training sample
____

Code bearbeiten und ausführen