1. Nauka
  2. /
  3. Kursy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

ćwiczenie

Przetwarzanie wstępne w potoku

Wiesz już, jakie kroki trzeba wykonać osobno, aby poprawnie przetworzyć dane dotyczące cen nieruchomości z Ames. Teraz skorzystaj z wygodniejszego podejścia opartego na DictVectorizer i umieść go razem z XGBoostRegressor wewnątrz potoku scikit-learn.

Instrukcje

100 XP
  • Zaimportuj DictVectorizer z sklearn.feature_extraction oraz Pipeline z sklearn.pipeline.
  • Uzupełnij brakujące wartości w kolumnie LotFrontage zbioru X wartością 0.
  • Uzupełnij kroki potoku: użyj DictVectorizer(sparse=False) dla "ohe_onestep" oraz xgb.XGBRegressor() dla "xgb_model".
  • Utwórz potok za pomocą Pipeline() i steps.
  • Dopasuj potok. Pamiętaj, aby przekonwertować X do formatu zrozumiałego dla DictVectorizer, wywołując na nim metodę to_dict("records").