Validasi silang model XGBoost Anda
Dalam latihan ini, Anda akan melangkah lebih jauh dengan menggunakan pipeline yang telah Anda buat untuk melakukan prapemrosesan dan validasi silang pada model Anda.
Latihan ini adalah bagian dari kursus
Extreme Gradient Boosting dengan XGBoost
Petunjuk latihan
- Buat pipeline bernama
xgb_pipelinemenggunakansteps. - Lakukan validasi silang 10-fold menggunakan
cross_val_score(). Anda harus memasukkan pipeline,X(sebagai kamus, menggunakan.to_dict("records")),y, jumlah lipatan yang ingin digunakan, danscoring("neg_mean_squared_error"). - Cetak RMSE 10-fold.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import necessary modules
from sklearn.feature_extraction import DictVectorizer
from sklearn.pipeline import Pipeline
from sklearn.model_selection import cross_val_score
# Fill LotFrontage missing values with 0
X.LotFrontage = ____
# Setup the pipeline steps: steps
steps = [("ohe_onestep", DictVectorizer(sparse=False)),
("xgb_model", xgb.XGBRegressor(max_depth=2, objective="reg:squarederror"))]
# Create the pipeline: xgb_pipeline
xgb_pipeline = ____
# Cross-validate the model
cross_val_scores = ____
# Print the 10-fold RMSE
print("10-fold RMSE: ", np.mean(np.sqrt(np.abs(____))))