Stacking di modelli I

Ora è il momento dello stacking. Per implementare lo stacking, seguirai i 6 passaggi di cui abbiamo parlato nel video precedente:

Dividi i dati di train in due parti
Allena più modelli sulla Parte 1
Fai previsioni sulla Parte 2
Fai previsioni sui dati di test
Allena un nuovo modello sulla Parte 2 usando le previsioni come feature
Fai previsioni sui dati di test usando il modello di 2° livello

I DataFrame train e test sono già disponibili nel tuo workspace. features è un elenco di colonne da usare per l’addestramento sui dati della Parte 1 ed è anch’esso disponibile nel tuo workspace. Il nome della variabile target è "fare_amount".

Questo esercizio fa parte del corso

Vincere una competizione Kaggle con Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Split train data into two parts
part_1, part_2 = ____(train, test_size=____, random_state=123)

# Train a Gradient Boosting model on Part 1
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model on Part 1
rf = RandomForestRegressor().____(____[features], ____.fare_amount)

Modifica ed esegui il codice