Zkoumání textových vektorů, část 2

S využitím funkce return_weights(), kterou jsi napsal(a) v předchozím cvičení, teď z každého dokumentu v textovém vektoru extrahuješ nejdůležitější slova, vrátíš seznam jejich indexů a pomocí tohoto seznamu textový vektor zreduguješ jen na tato slova.

Zavolej return_weights(), aby funkce vrátila slova s nejvyšší váhou pro daný dokument.
Zavolej set() na vrácený filter_list, čímž odstraníš duplicitní čísla.
Zavolej words_to_filter s těmito parametry: vocab pro parametr vocab, tfidf_vec.vocabulary_ pro parametr original_vocab, text_tfidf pro parametr vector a 3 pro parametr top_n, čímž z každého dokumentu vezmeš 3 slova s nejvyšší váhou.
Nakonec převeď sadu filtered_words na seznam a použij ho jako filtr pro textový vektor.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení