Kodowanie kolumn kategorycznych III: DictVectorizer

Świetnie, jeszcze jedna sztuczka, zanim przejdziesz do potoków. Dwuetapowy proces, przez który właśnie przeszłeś – LabelEncoder a następnie OneHotEncoder – można uprościć, korzystając z DictVectorizer.

Użycie DictVectorizer na DataFrame przekonwertowanym do słownika pozwala uzyskać zarówno kodowanie etykiet, jak i kodowanie „one-hot" w jednym kroku.

Twoim zadaniem jest zastosowanie tej strategii w tym ćwiczeniu!

Zaimportuj DictVectorizer z sklearn.feature_extraction.
Przekonwertuj df do słownika o nazwie df_dict, używając metody .to_dict() z argumentem "records".
Utwórz instancję obiektu DictVectorizer o nazwie dv z argumentem kluczowym sparse=False.
Zastosuj DictVectorizer na df_dict, wywołując metodę .fit_transform().
Kliknij „Prześlij odpowiedź", aby wyświetlić pięć pierwszych wierszy wyniku oraz słownik cech.

ćwiczenie

Kodowanie kolumn kategorycznych III: DictVectorizer

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie