CommencerCommencer gratuitement

Mélange de modèles

Vous allez commencer à créer des ensembles de modèles avec une technique de blending.

Votre objectif est d’entraîner 2 modèles différents sur les données de la compétition New York City Taxi. Réalisez des prédictions sur les données de test, puis mélangez-les en utilisant une simple moyenne arithmétique.

Les DataFrames train et test sont déjà disponibles dans votre espace de travail. features est une liste de colonnes à utiliser pour l’entraînement et elle est également disponible. La variable cible s’appelle « fare_amount ».

Cet exercice fait partie du cours

Gagner une compétition Kaggle en Python

Afficher le cours

Instructions

  • Entraînez un modèle Gradient Boosting sur les données d’entraînement en utilisant la liste features, et la colonne « fare_amount » comme variable cible.
  • Entraînez un modèle Random Forest de la même manière.
  • Faites des prédictions sur les données de test avec les modèles Gradient Boosting et Random Forest.
  • Calculez la moyenne des prédictions des deux modèles.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Train a Gradient Boosting model
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model
rf = RandomForestRegressor().____(____[features], ____.fare_amount)

# Make predictions on the test data
test['gb_pred'] = ____.____(test[features])
test['rf_pred'] = ____.____(test[features])

# Find mean of model predictions
test['blend'] = (____[____] + ____[____]) / 2
print(test[['gb_pred', 'rf_pred', 'blend']].head(3))
Modifier et exécuter le code