LoslegenKostenlos loslegen

Model Blending

Du beginnst mit dem Erstellen von Modell-Ensembles mithilfe der Blending-Technik.

Dein Ziel ist es, 2 unterschiedliche Modelle auf den Daten des New York City Taxi-Wettbewerbs zu trainieren. Erstelle Vorhersagen für die Testdaten und mische sie anschließend über das einfache arithmetische Mittel.

Die DataFrames train und test sind bereits in deinem Workspace verfügbar. features ist eine Liste von Spalten für das Training und ebenfalls verfügbar. Der Name der Zielvariable ist "fare_amount".

Diese Übung ist Teil des Kurses

Eine Kaggle-Competition in Python gewinnen

Kurs anzeigen

Anleitung zur Übung

  • Trainiere ein Gradient-Boosting-Modell auf den Trainingsdaten mithilfe der Liste features und der Spalte "fare_amount" als Zielvariable.
  • Trainiere ein Random-Forest-Modell auf die gleiche Weise.
  • Erstelle Vorhersagen für die Testdaten mit beiden Modellen (Gradient Boosting und Random Forest).
  • Bestimme den Durchschnitt der Vorhersagen beider Modelle.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Train a Gradient Boosting model
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model
rf = RandomForestRegressor().____(____[features], ____.fare_amount)

# Make predictions on the test data
test['gb_pred'] = ____.____(test[features])
test['rf_pred'] = ____.____(test[features])

# Find mean of model predictions
test['blend'] = (____[____] + ____[____]) / 2
print(test[['gb_pred', 'rf_pred', 'blend']].head(3))
Code bearbeiten und ausführen