BaşlayınÜcretsiz Başlayın

Bir pipeline içinde ön işleme

Ames konut verilerini doğru şekilde işlemek için tek tek hangi adımların gerektiğini gördüğüne göre, şimdi çok daha temiz ve öz olan DictVectorizer yaklaşımını kullanalım ve bunu scikit-learn pipeline'ı içinde bir XGBoostRegressor ile yan yana koyalım.

Bu egzersiz

XGBoost ile Aşırı Gradyan Artırma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • sklearn.feature_extraction içinden DictVectorizer ve sklearn.pipeline içinden Pipeline'ı içe aktar.
  • X'in LotFrontage sütunundaki eksik değerleri 0 ile doldur.
  • Pipeline adımlarını "ohe_onestep" için DictVectorizer(sparse=False) ve "xgb_model" için xgb.XGBRegressor() ile tamamla.
  • Pipeline() ve steps kullanarak pipeline'ı oluştur.
  • Pipeline'ı fit et. DictVectorizer'ın anlayacağı bir formata dönüştürmek için X üzerinde to_dict("records") metodunu çağırmayı unutma.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import necessary modules
____
____

# Fill LotFrontage missing values with 0
X.LotFrontage = ____

# Setup the pipeline steps: steps
steps = [("ohe_onestep", ____),
         ("xgb_model", ____)]

# Create the pipeline: xgb_pipeline
xgb_pipeline = ____

# Fit the pipeline
____
Kodu Düzenle ve Çalıştır