IniziaInizia gratis

Stacking di modelli I

Ora è il momento dello stacking. Per implementare lo stacking, seguirai i 6 passaggi di cui abbiamo parlato nel video precedente:

  1. Dividi i dati di train in due parti
  2. Allena più modelli sulla Parte 1
  3. Fai previsioni sulla Parte 2
  4. Fai previsioni sui dati di test
  5. Allena un nuovo modello sulla Parte 2 usando le previsioni come feature
  6. Fai previsioni sui dati di test usando il modello di 2° livello

I DataFrame train e test sono già disponibili nel tuo workspace. features è un elenco di colonne da usare per l’addestramento sui dati della Parte 1 ed è anch’esso disponibile nel tuo workspace. Il nome della variabile target è "fare_amount".

Questo esercizio fa parte del corso

Vincere una competizione Kaggle con Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingRegressor, RandomForestRegressor

# Split train data into two parts
part_1, part_2 = ____(train, test_size=____, random_state=123)

# Train a Gradient Boosting model on Part 1
gb = GradientBoostingRegressor().____(____[features], ____.fare_amount)

# Train a Random Forest model on Part 1
rf = RandomForestRegressor().____(____[features], ____.fare_amount)
Modifica ed esegui il codice