Stacking di modelli I
Ora è il momento dello stacking. Per implementare lo stacking, seguirai i 6 passaggi di cui abbiamo parlato nel video precedente:
- Dividi i dati di train in due parti
- Allena più modelli sulla Parte 1
- Fai previsioni sulla Parte 2
- Fai previsioni sui dati di test
- Allena un nuovo modello sulla Parte 2 usando le previsioni come feature
- Fai previsioni sui dati di test usando il modello di 2° livello
I DataFrame train e test sono già disponibili nel tuo workspace. features è un elenco di colonne da usare per l’addestramento sui dati della Parte 1 ed è anch’esso disponibile nel tuo workspace. Il nome della variabile target è "fare_amount".
Questo esercizio fa parte del corso
Vincere una competizione Kaggle con Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor
# Split train data into two parts
part_1, part_2 = ____(train, test_size=____, random_state=123)
# Train a Gradient Boosting model on Part 1
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)
# Train a Random Forest model on Part 1
rf = RandomForestRegressor().____(____[features], ____.fare_amount)