MulaiMulai sekarang secara gratis

Validasi silang model XGBoost Anda

Dalam latihan ini, Anda akan melangkah lebih jauh dengan menggunakan pipeline yang telah Anda buat untuk melakukan prapemrosesan dan validasi silang pada model Anda.

Latihan ini adalah bagian dari kursus

Extreme Gradient Boosting dengan XGBoost

Lihat Kursus

Petunjuk latihan

  • Buat pipeline bernama xgb_pipeline menggunakan steps.
  • Lakukan validasi silang 10-fold menggunakan cross_val_score(). Anda harus memasukkan pipeline, X (sebagai kamus, menggunakan .to_dict("records")), y, jumlah lipatan yang ingin digunakan, dan scoring ("neg_mean_squared_error").
  • Cetak RMSE 10-fold.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import necessary modules
from sklearn.feature_extraction import DictVectorizer
from sklearn.pipeline import Pipeline
from sklearn.model_selection import cross_val_score

# Fill LotFrontage missing values with 0
X.LotFrontage = ____

# Setup the pipeline steps: steps
steps = [("ohe_onestep", DictVectorizer(sparse=False)),
         ("xgb_model", xgb.XGBRegressor(max_depth=2, objective="reg:squarederror"))]

# Create the pipeline: xgb_pipeline
xgb_pipeline = ____

# Cross-validate the model
cross_val_scores = ____

# Print the 10-fold RMSE
print("10-fold RMSE: ", np.mean(np.sqrt(np.abs(____))))
Edit dan Jalankan Kode