1. Learn
  2. /
  3. Курси
  4. /
  5. Передобробка для машинного навчання в Python

Connected

вправа

Дослідження текстових векторів, частина 2

Використовуючи функцію return_weights(), яку ви написали у попередній вправі, тепер ви дістанете найважливіші слова з кожного документа у текстовому векторі, повернете список індексів слів і використаєте цей список, щоб відфільтрувати текстовий вектор до цих топслів.

Інструкції

100 XP
  • Викличте return_weights(), щоб повернути слова з найбільшими вагами для цього документа.
  • Викличте set() для повернутого filter_list, щоб прибрати дублікати чисел.
  • Викличте words_to_filter, передавши такі параметри: vocab для параметра vocab, tfidf_vec.vocabulary_ для параметра original_vocab, text_tfidf для параметра vector і 3, щоб узяти top_n 3 зважені слова з кожного документа.
  • Нарешті, передайте множину filtered_words у list, щоб використати її як фільтр для текстового вектора.