Badanie wektorów tekstowych, część 2

Korzystając z funkcji return_weights(), którą napisano w poprzednim ćwiczeniu, wyodrębnisz teraz najważniejsze słowa z każdego dokumentu w wektorze tekstowym, zwrócisz listę indeksów tych słów, a następnie użyjesz jej do odfiltrowania wektora tekstowego do tych najważniejszych słów.

Wywołaj return_weights(), aby zwrócić słowa o najwyższych wagach dla danego dokumentu.
Wywołaj set() na zwróconej liście filter_list, aby usunąć powtarzające się liczby.
Wywołaj words_to_filter, przekazując następujące parametry: vocab dla parametru vocab, tfidf_vec.vocabulary_ dla parametru original_vocab, text_tfidf dla parametru vector oraz 3, aby pobrać top_n 3 słów o najwyższych wagach z każdego dokumentu.
Na koniec przekształć zbiór filtered_words w listę, aby użyć go jako filtra dla wektora tekstowego.

ćwiczenie

Badanie wektorów tekstowych, część 2

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie