Empilhamento de modelos I

Agora é hora de fazer stacking. Para implementar essa abordagem, você vai seguir os 6 passos que vimos no vídeo anterior:

Divida os dados de treino em duas partes
Treine vários modelos na Parte 1
Faça previsões na Parte 2
Faça previsões nos dados de teste
Treine um novo modelo na Parte 2 usando as previsões como features
Faça previsões nos dados de teste usando o modelo de 2º nível

Os DataFrames train e test já estão disponíveis no seu ambiente. features é uma lista de colunas a serem usadas para treinar nos dados da Parte 1 e também está disponível no seu ambiente. O nome da variável-alvo é "fare_amount".

Este exercicio faz parte do curso

Vencendo uma competição do Kaggle em Python

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Split train data into two parts
part_1, part_2 = ____(train, test_size=____, random_state=123)

# Train a Gradient Boosting model on Part 1
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model on Part 1
rf = RandomForestRegressor().____(____[features], ____.fare_amount)

Editar e Executar Código