1. Nauka
  2. /
  3. Kursy
  4. /
  5. Preprocessing w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Badanie wektorów tekstowych, część 2

Korzystając z funkcji return_weights(), którą napisano w poprzednim ćwiczeniu, wyodrębnisz teraz najważniejsze słowa z każdego dokumentu w wektorze tekstowym, zwrócisz listę indeksów tych słów, a następnie użyjesz jej do odfiltrowania wektora tekstowego do tych najważniejszych słów.

Instrukcje

100 XP
  • Wywołaj return_weights(), aby zwrócić słowa o najwyższych wagach dla danego dokumentu.
  • Wywołaj set() na zwróconej liście filter_list, aby usunąć powtarzające się liczby.
  • Wywołaj words_to_filter, przekazując następujące parametry: vocab dla parametru vocab, tfidf_vec.vocabulary_ dla parametru original_vocab, text_tfidf dla parametru vector oraz 3, aby pobrać top_n 3 słów o najwyższych wagach z każdego dokumentu.
  • Na koniec przekształć zbiór filtered_words w listę, aby użyć go jako filtra dla wektora tekstowego.