Training mit Bootstrapping
Baue nun einen „schwachen“ Decision-Tree-Klassifikator und trainiere ihn auf einer Stichprobe des Trainingssatzes, die mit Zurücklegen gezogen wurde. So verstehst du, was bei jeder Iteration eines Bagging-Ensembles passiert.
Zum Ziehen einer Stichprobe verwendest du die pandas-Methode .sample(), die einen Parameter replace hat. Zum Beispiel zieht die folgende Codezeile mit Zurücklegen aus dem gesamten DataFrame df:
df.sample(frac=1.0, replace=True, random_state=42)
Diese Übung ist Teil des Kurses
Ensemble-Methoden in Python
Anleitung zur Übung
- Ziehe eine Stichprobe mit Zurücklegen (
replace=True) aus dem gesamten (frac=1.0) TrainingssatzX_train. - Baue einen Decision-Tree-Klassifikator mit dem Parameter
max_depth = 4. - Fitte das Modell auf die gezogenen Trainingsdaten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Take a sample with replacement
X_train_sample = X_train.____(____, ____, random_state=42)
y_train_sample = y_train.loc[X_train_sample.index]
# Build a "weak" Decision Tree classifier
clf = ____(____, random_state=500)
# Fit the model to the training sample
____