1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

ćwiczenie

Mapowanie indeksów cech na nazwy cech

W filmie lekcyjnym widziałeś, że CountVectorizer nie zawsze indeksuje słownik w kolejności alfabetycznej. W tym ćwiczeniu nauczysz się mapować każdy indeks cechy na odpowiadającą mu nazwę ze słownika.

Wykorzystamy te same trzy zdania o lwach, co w filmie. Zdania są dostępne na liście o nazwie corpus i zostały już wyświetlone w konsoli.

Instrukcje

100 XP
  • Utwórz obiekt CountVectorizer i nadaj mu nazwę vectorizer.
  • Używając metody fit_transform(), wygeneruj bow_matrix dla corpus.
  • Używając metody get_feature_names(), przypisz nazwy kolumn do odpowiadających im słów ze słownika.