Mistura de modelos (blending)
Você vai começar a criar conjuntos de modelos usando a técnica de blending.
Seu objetivo é treinar 2 modelos diferentes com os dados da competição New York City Taxi. Faça previsões no conjunto de teste e depois combine-as usando a média aritmética simples.
Os DataFrames train e test já estão disponíveis no seu ambiente. features é uma lista de colunas a serem usadas no treinamento e também está disponível no seu ambiente. O nome da variável-alvo é "fare_amount".
Este exercício faz parte do curso
Vencendo uma competição do Kaggle em Python
Instruções do exercício
- Treine um modelo de Gradient Boosting nos dados de treino usando a lista
featurese a coluna "fare_amount" como variável-alvo. - Treine um modelo de Random Forest da mesma forma.
- Faça previsões nos dados de teste usando ambos os modelos, Gradient Boosting e Random Forest.
- Calcule a média das previsões dos dois modelos.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor
# Train a Gradient Boosting model
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)
# Train a Random Forest model
rf = RandomForestRegressor().____(____[features], ____.fare_amount)
# Make predictions on the test data
test['gb_pred'] = ____.____(test[features])
test['rf_pred'] = ____.____(test[features])
# Find mean of model predictions
test['blend'] = (____[____] + ____[____]) / 2
print(test[['gb_pred', 'rf_pred', 'blend']].head(3))