Model Blending
Du beginnst mit dem Erstellen von Modell-Ensembles mithilfe der Blending-Technik.
Dein Ziel ist es, 2 unterschiedliche Modelle auf den Daten des New York City Taxi-Wettbewerbs zu trainieren. Erstelle Vorhersagen für die Testdaten und mische sie anschließend über das einfache arithmetische Mittel.
Die DataFrames train und test sind bereits in deinem Workspace verfügbar. features ist eine Liste von Spalten für das Training und ebenfalls verfügbar. Der Name der Zielvariable ist "fare_amount".
Diese Übung ist Teil des Kurses
Eine Kaggle-Competition in Python gewinnen
Anleitung zur Übung
- Trainiere ein Gradient-Boosting-Modell auf den Trainingsdaten mithilfe der Liste
featuresund der Spalte "fare_amount" als Zielvariable. - Trainiere ein Random-Forest-Modell auf die gleiche Weise.
- Erstelle Vorhersagen für die Testdaten mit beiden Modellen (Gradient Boosting und Random Forest).
- Bestimme den Durchschnitt der Vorhersagen beider Modelle.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor
# Train a Gradient Boosting model
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)
# Train a Random Forest model
rf = RandomForestRegressor().____(____[features], ____.fare_amount)
# Make predictions on the test data
test['gb_pred'] = ____.____(test[features])
test['rf_pred'] = ____.____(test[features])
# Find mean of model predictions
test['blend'] = (____[____] + ____[____]) / 2
print(test[['gb_pred', 'rf_pred', 'blend']].head(3))