cvičení

Předzpracování dat v rámci pipeline

Teď, když víš, jaké kroky je potřeba provést pro správné zpracování dat o bydlení z Ames, využijeme přehlednější přístup s DictVectorizer a zařadíme ho spolu s XGBoostRegressor do scikit-learn pipeline.

Pokyny

100 XP

Importuj DictVectorizer z sklearn.feature_extraction a Pipeline z sklearn.pipeline.
Doplň chybějící hodnoty ve sloupci LotFrontage v X hodnotou 0.
Dokonči kroky pipeline: pro "ohe_onestep" použij DictVectorizer(sparse=False) a pro "xgb_model" použij xgb.XGBRegressor().
Vytvoř pipeline pomocí Pipeline() a steps.
Natrénuj pipeline. Nezapomeň převést X do formátu, kterému DictVectorizer rozumí – zavolej na X metodu to_dict("records").

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení