Latih model XGBoost
Setiap metode Machine Learning berpotensi mengalami overfitting. Anda akan melihatnya pada contoh ini dengan XGBoost. Anda kembali bekerja pada tantangan Store Item Demand Forecasting. DataFrame train tersedia di workspace Anda.
Pertama, mari latih beberapa model XGBoost dengan kumpulan hyperparameter yang berbeda menggunakan learning API XGBoost. Satu-satunya hyperparameter yang akan Anda ubah adalah:
max_depth- kedalaman maksimum sebuah pohon. Menaikkan nilai ini akan membuat model lebih kompleks dan lebih rentan terhadap overfitting.
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
import xgboost as xgb
# Create DMatrix on train data
dtrain = xgb.DMatrix(data=train[['store', 'item']],
label=train['sales'])
# Define xgboost parameters
params = {'objective': 'reg:linear',
'____': ____,
'verbosity': 0}
# Train xgboost model
xg_depth_2 = xgb.train(params=params, dtrain=dtrain)