Model Blending

Du beginnst mit dem Erstellen von Modell-Ensembles mithilfe der Blending-Technik.

Dein Ziel ist es, 2 unterschiedliche Modelle auf den Daten des New York City Taxi-Wettbewerbs zu trainieren. Erstelle Vorhersagen für die Testdaten und mische sie anschließend über das einfache arithmetische Mittel.

Die DataFrames train und test sind bereits in deinem Workspace verfügbar. features ist eine Liste von Spalten für das Training und ebenfalls verfügbar. Der Name der Zielvariable ist "fare_amount".

Diese Übung ist Teil des Kurses

<Kurs>Eine Kaggle-Competition in Python gewinnen</Kurs>

Kurs ansehen

Übungsanweisungen

Trainiere ein Gradient-Boosting-Modell auf den Trainingsdaten mithilfe der Liste features und der Spalte "fare_amount" als Zielvariable.
Trainiere ein Random-Forest-Modell auf die gleiche Weise.
Erstelle Vorhersagen für die Testdaten mit beiden Modellen (Gradient Boosting und Random Forest).
Bestimme den Durchschnitt der Vorhersagen beider Modelle.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Train a Gradient Boosting model
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model
rf = RandomForestRegressor().____(____[features], ____.fare_amount)

# Make predictions on the test data
test['gb_pred'] = ____.____(test[features])
test['rf_pred'] = ____.____(test[features])

# Find mean of model predictions
test['blend'] = (____[____] + ____[____]) / 2
print(test[['gb_pred', 'rf_pred', 'blend']].head(3))

Code bearbeiten und ausführen