Bir pipeline içinde ön işleme

Ames konut verilerini doğru şekilde işlemek için tek tek hangi adımların gerektiğini gördüğüne göre, şimdi çok daha temiz ve öz olan DictVectorizer yaklaşımını kullanalım ve bunu scikit-learn pipeline'ı içinde bir XGBoostRegressor ile yan yana koyalım.

Bu egzersiz, kursun bir parçasıdır

XGBoost ile Aşırı Gradyan Artırma

Kursa Göz Atın

Egzersiz talimatları

sklearn.feature_extraction içinden DictVectorizer ve sklearn.pipeline içinden Pipeline'ı içe aktar.
X'in LotFrontage sütunundaki eksik değerleri 0 ile doldur.
Pipeline adımlarını "ohe_onestep" için DictVectorizer(sparse=False) ve "xgb_model" için xgb.XGBRegressor() ile tamamla.
Pipeline() ve steps kullanarak pipeline'ı oluştur.
Pipeline'ı fit et. DictVectorizer'ın anlayacağı bir formata dönüştürmek için X üzerinde to_dict("records") metodunu çağırmayı unutma.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import necessary modules
____
____

# Fill LotFrontage missing values with 0
X.LotFrontage = ____

# Setup the pipeline steps: steps
steps = [("ohe_onestep", ____),
         ("xgb_model", ____)]

# Create the pipeline: xgb_pipeline
xgb_pipeline = ____

# Fit the pipeline
____

Kodu Düzenle ve Çalıştır