Mélange de modèles

Vous allez commencer à créer des ensembles de modèles avec une technique de blending.

Votre objectif est d’entraîner 2 modèles différents sur les données de la compétition New York City Taxi. Réalisez des prédictions sur les données de test, puis mélangez-les en utilisant une simple moyenne arithmétique.

Les DataFrames train et test sont déjà disponibles dans votre espace de travail. features est une liste de colonnes à utiliser pour l’entraînement et elle est également disponible. La variable cible s’appelle « fare_amount ».

Cet exercice fait partie du cours

Gagner une compétition Kaggle en Python

Afficher le cours

Instructions

Entraînez un modèle Gradient Boosting sur les données d’entraînement en utilisant la liste features, et la colonne « fare_amount » comme variable cible.
Entraînez un modèle Random Forest de la même manière.
Faites des prédictions sur les données de test avec les modèles Gradient Boosting et Random Forest.
Calculez la moyenne des prédictions des deux modèles.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Train a Gradient Boosting model
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model
rf = RandomForestRegressor().____(____[features], ____.fare_amount)

# Make predictions on the test data
test['gb_pred'] = ____.____(test[features])
test['rf_pred'] = ____.____(test[features])

# Find mean of model predictions
test['blend'] = (____[____] + ____[____]) / 2
print(test[['gb_pred', 'rf_pred', 'blend']].head(3))

Modifier et exécuter le code