ComeçarComece de graça

Empilhamento de modelos I

Agora é hora de fazer stacking. Para implementar essa abordagem, você vai seguir os 6 passos que vimos no vídeo anterior:

  1. Divida os dados de treino em duas partes
  2. Treine vários modelos na Parte 1
  3. Faça previsões na Parte 2
  4. Faça previsões nos dados de teste
  5. Treine um novo modelo na Parte 2 usando as previsões como features
  6. Faça previsões nos dados de teste usando o modelo de 2º nível

Os DataFrames train e test já estão disponíveis no seu ambiente. features é uma lista de colunas a serem usadas para treinar nos dados da Parte 1 e também está disponível no seu ambiente. O nome da variável-alvo é "fare_amount".

Este exercício faz parte do curso

Vencendo uma competição do Kaggle em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Split train data into two parts
part_1, part_2 = ____(train, test_size=____, random_state=123)

# Train a Gradient Boosting model on Part 1
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model on Part 1
rf = RandomForestRegressor().____(____[features], ____.fare_amount)
Editar e executar o código