Validasi silang model XGBoost Anda
Dalam latihan ini, Anda akan melangkah lebih jauh dengan menggunakan pipeline yang telah Anda buat untuk melakukan prapemrosesan dan validasi silang pada model Anda.
Latihan ini merupakan bagian dari kursus
Extreme Gradient Boosting dengan XGBoost
Instruksi latihan
- Buat pipeline bernama
xgb_pipelinemenggunakansteps. - Lakukan validasi silang 10-fold menggunakan
cross_val_score(). Anda harus memasukkan pipeline,X(sebagai kamus, menggunakan.to_dict("records")),y, jumlah lipatan yang ingin digunakan, danscoring("neg_mean_squared_error"). - Cetak RMSE 10-fold.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import necessary modules
from sklearn.feature_extraction import DictVectorizer
from sklearn.pipeline import Pipeline
from sklearn.model_selection import cross_val_score
# Fill LotFrontage missing values with 0
X.LotFrontage = ____
# Setup the pipeline steps: steps
steps = [("ohe_onestep", DictVectorizer(sparse=False)),
("xgb_model", xgb.XGBRegressor(max_depth=2, objective="reg:squarederror"))]
# Create the pipeline: xgb_pipeline
xgb_pipeline = ____
# Cross-validate the model
cross_val_scores = ____
# Print the 10-fold RMSE
print("10-fold RMSE: ", np.mean(np.sqrt(np.abs(____))))