Bir pipeline içinde ön işleme
Ames konut verilerini doğru şekilde işlemek için tek tek hangi adımların gerektiğini gördüğüne göre, şimdi çok daha temiz ve öz olan DictVectorizer yaklaşımını kullanalım ve bunu scikit-learn pipeline'ı içinde bir XGBoostRegressor ile yan yana koyalım.
Bu egzersiz, kursun bir parçasıdır
XGBoost ile Aşırı Gradyan Artırma
Egzersiz talimatları
sklearn.feature_extractioniçindenDictVectorizervesklearn.pipelineiçindenPipeline'ı içe aktar.X'inLotFrontagesütunundaki eksik değerleri0ile doldur.- Pipeline adımlarını
"ohe_onestep"içinDictVectorizer(sparse=False)ve"xgb_model"içinxgb.XGBRegressor()ile tamamla. Pipeline()vestepskullanarak pipeline'ı oluştur.Pipeline'ı fit et.DictVectorizer'ın anlayacağı bir formata dönüştürmek içinXüzerindeto_dict("records")metodunu çağırmayı unutma.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import necessary modules
____
____
# Fill LotFrontage missing values with 0
X.LotFrontage = ____
# Setup the pipeline steps: steps
steps = [("ohe_onestep", ____),
("xgb_model", ____)]
# Create the pipeline: xgb_pipeline
xgb_pipeline = ____
# Fit the pipeline
____