1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

cvičení

Předzpracování dat v rámci pipeline

Teď, když víš, jaké kroky je potřeba provést pro správné zpracování dat o bydlení z Ames, využijeme přehlednější přístup s DictVectorizer a zařadíme ho spolu s XGBoostRegressor do scikit-learn pipeline.

Pokyny

100 XP
  • Importuj DictVectorizer z sklearn.feature_extraction a Pipeline z sklearn.pipeline.
  • Doplň chybějící hodnoty ve sloupci LotFrontage v X hodnotou 0.
  • Dokonči kroky pipeline: pro "ohe_onestep" použij DictVectorizer(sparse=False) a pro "xgb_model" použij xgb.XGBRegressor().
  • Vytvoř pipeline pomocí Pipeline() a steps.
  • Natrénuj pipeline. Nezapomeň převést X do formátu, kterému DictVectorizer rozumí – zavolej na X metodu to_dict("records").