1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

cvičení

Kódování kategorických sloupců III: DictVectorizer

Než se pustíme do pipeline, ještě jeden užitečný trik. Dvoustupňový postup, kterým jsi právě prošel/prošla – LabelEncoder následovaný OneHotEncoder – lze zjednodušit pomocí DictVectorizer.

Použití DictVectorizer na DataFrame převedený do slovníku ti umožní provést label encoding i one-hot encoding najednou.

V tomto cvičení si celý postup vyzkoušíš!

Pokyny

100 XP
  • Importuj DictVectorizer z sklearn.feature_extraction.
  • Převeď df na slovník s názvem df_dict pomocí metody .to_dict() s argumentem "records".
  • Vytvoř instanci objektu DictVectorizer s názvem dv s argumentem sparse=False.
  • Aplikuj DictVectorizer na df_dict pomocí metody .fit_transform().
  • Klikni na Submit Answer a zobraz prvních pět řádků výsledku a slovník příznaků.