Convalida incrociata dei modelli di credito
I prestiti e i relativi dati cambiano nel tempo e non sempre assomigliano a ciò che è stato caricato negli attuali insiemi di test. Per questo puoi usare la convalida incrociata per provare diversi insiemi di addestramento e test più piccoli derivati dagli originali X_train e y_train.
Usa la funzione cv() di XGBoost per eseguire la convalida incrociata. Dovrai impostare tutti i parametri che cv() utilizzerà sui dati di test.
Gli insiemi di dati X_train, y_train sono caricati nell'ambiente di lavoro insieme al modello addestrato gbt e al dizionario dei parametri params, che verrà stampato all'avvio dell'esercizio.
Questo esercizio fa parte del corso
Credit Risk Modeling in Python
Istruzioni dell'esercizio
- Imposta il numero di fold a
5e l'early stopping a10. Salvali comen_foldsedearly_stopping. - Crea l'oggetto matrice
DTrainusando i dati di addestramento. - Usa
cv()sui parametri, sui fold e sull'early stopping. Salva i risultati comecv_df. - Stampa il contenuto di
cv_df.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set the values for number of folds and stopping iterations
____ = ____
____ = ____
# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)
# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
early_stopping_rounds=____)
# Print the cross validations data frame
____(____)