Model-Stacking I

Jetzt ist Stacking an der Reihe. Um den Stacking-Ansatz umzusetzen, folgst du den 6 Schritten aus dem vorherigen Video:

Trainingsdaten in zwei Teile aufteilen
Mehrere Modelle auf Teil 1 trainieren
Vorhersagen für Teil 2 erstellen
Vorhersagen für die Testdaten erstellen
Ein neues Modell auf Teil 2 trainieren und dabei die Vorhersagen als Features verwenden
Mit dem Modell der 2. Ebene Vorhersagen für die Testdaten erstellen

Die DataFrames train und test sind bereits in deinem Workspace vorhanden. features ist eine Liste von Spalten, die für das Training auf den Teil-1-Daten verwendet werden sollen, und ist ebenfalls verfügbar. Der Name der Zielvariable ist "fare_amount".

Diese Übung ist Teil des Kurses

<Kurs>Eine Kaggle-Competition in Python gewinnen</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Split train data into two parts
part_1, part_2 = ____(train, test_size=____, random_state=123)

# Train a Gradient Boosting model on Part 1
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model on Part 1
rf = RandomForestRegressor().____(____[features], ____.fare_amount)

Code bearbeiten und ausführen