Mistura de modelos (blending)

Você vai começar a criar conjuntos de modelos usando a técnica de blending.

Seu objetivo é treinar 2 modelos diferentes com os dados da competição New York City Taxi. Faça previsões no conjunto de teste e depois combine-as usando a média aritmética simples.

Os DataFrames train e test já estão disponíveis no seu ambiente. features é uma lista de colunas a serem usadas no treinamento e também está disponível no seu ambiente. O nome da variável-alvo é "fare_amount".

Este exercício faz parte do curso

Vencendo uma competição do Kaggle em Python

Ver curso

Instruções do exercício

Treine um modelo de Gradient Boosting nos dados de treino usando a lista features e a coluna "fare_amount" como variável-alvo.
Treine um modelo de Random Forest da mesma forma.
Faça previsões nos dados de teste usando ambos os modelos, Gradient Boosting e Random Forest.
Calcule a média das previsões dos dois modelos.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Train a Gradient Boosting model
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model
rf = RandomForestRegressor().____(____[features], ____.fare_amount)

# Make predictions on the test data
test['gb_pred'] = ____.____(test[features])
test['rf_pred'] = ____.____(test[features])

# Find mean of model predictions
test['blend'] = (____[____] + ____[____]) / 2
print(test[['gb_pred', 'rf_pred', 'blend']].head(3))

Editar e executar o código