LoslegenKostenlos loslegen

Model-Stacking I

Jetzt ist Stacking an der Reihe. Um den Stacking-Ansatz umzusetzen, folgst du den 6 Schritten aus dem vorherigen Video:

  1. Trainingsdaten in zwei Teile aufteilen
  2. Mehrere Modelle auf Teil 1 trainieren
  3. Vorhersagen für Teil 2 erstellen
  4. Vorhersagen für die Testdaten erstellen
  5. Ein neues Modell auf Teil 2 trainieren und dabei die Vorhersagen als Features verwenden
  6. Mit dem Modell der 2. Ebene Vorhersagen für die Testdaten erstellen

Die DataFrames train und test sind bereits in deinem Workspace vorhanden. features ist eine Liste von Spalten, die für das Training auf den Teil-1-Daten verwendet werden sollen, und ist ebenfalls verfügbar. Der Name der Zielvariable ist "fare_amount".

Diese Übung ist Teil des Kurses

Eine Kaggle-Competition in Python gewinnen

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Split train data into two parts
part_1, part_2 = ____(train, test_size=____, random_state=123)

# Train a Gradient Boosting model on Part 1
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model on Part 1
rf = RandomForestRegressor().____(____[features], ____.fare_amount)
Code bearbeiten und ausführen