1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering for NLP in Python

Connected

cvičení

Mapování indexů příznaků na jejich názvy

Ve videu jsme viděli, že CountVectorizer neindexuje slovník nutně v abecedním pořadí. V tomto cvičení se naučíš, jak přiřadit každý index příznaku odpovídajícímu slovu ze slovníku.

Použijeme stejné tři věty o lvech z videa. Věty jsou dostupné v seznamu corpus a byly již vypsány do konzole.

Pokyny

100 XP
  • Vytvoř instanci objektu CountVectorizer a pojmenuj ji vectorizer.
  • Pomocí fit_transform() vygeneruj bow_matrix pro corpus.
  • Pomocí metody get_feature_names() namapuj názvy sloupců na odpovídající slova ze slovníku.