1. Nauka
  2. /
  3. Kursy
  4. /
  5. Extreme Gradient Boosting with XGBoost

Connected

ćwiczenie

Kodowanie kolumn kategorycznych III: DictVectorizer

Świetnie, jeszcze jedna sztuczka, zanim przejdziesz do potoków. Dwuetapowy proces, przez który właśnie przeszłeś – LabelEncoder a następnie OneHotEncoder – można uprościć, korzystając z DictVectorizer.

Użycie DictVectorizer na DataFrame przekonwertowanym do słownika pozwala uzyskać zarówno kodowanie etykiet, jak i kodowanie „one-hot" w jednym kroku.

Twoim zadaniem jest zastosowanie tej strategii w tym ćwiczeniu!

Instrukcje

100 XP
  • Zaimportuj DictVectorizer z sklearn.feature_extraction.
  • Przekonwertuj df do słownika o nazwie df_dict, używając metody .to_dict() z argumentem "records".
  • Utwórz instancję obiektu DictVectorizer o nazwie dv z argumentem kluczowym sparse=False.
  • Zastosuj DictVectorizer na df_dict, wywołując metodę .fit_transform().
  • Kliknij „Prześlij odpowiedź", aby wyświetlić pięć pierwszych wierszy wyniku oraz słownik cech.