Bir pipeline içinde ön işleme
Ames konut verilerini doğru şekilde işlemek için tek tek hangi adımların gerektiğini gördüğüne göre, şimdi çok daha temiz ve öz olan DictVectorizer yaklaşımını kullanalım ve bunu scikit-learn pipeline'ı içinde bir XGBoostRegressor ile yan yana koyalım.
Bu egzersiz
XGBoost ile Aşırı Gradyan Artırma
kursunun bir parçasıdırEgzersiz talimatları
sklearn.feature_extractioniçindenDictVectorizervesklearn.pipelineiçindenPipeline'ı içe aktar.X'inLotFrontagesütunundaki eksik değerleri0ile doldur.- Pipeline adımlarını
"ohe_onestep"içinDictVectorizer(sparse=False)ve"xgb_model"içinxgb.XGBRegressor()ile tamamla. Pipeline()vestepskullanarak pipeline'ı oluştur.Pipeline'ı fit et.DictVectorizer'ın anlayacağı bir formata dönüştürmek içinXüzerindeto_dict("records")metodunu çağırmayı unutma.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import necessary modules
____
____
# Fill LotFrontage missing values with 0
X.LotFrontage = ____
# Setup the pipeline steps: steps
steps = [("ohe_onestep", ____),
("xgb_model", ____)]
# Create the pipeline: xgb_pipeline
xgb_pipeline = ____
# Fit the pipeline
____