1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w Pythonie

Connected

ćwiczenie

Tf-idf z Wikipedią

Czas, żebyś samodzielnie wyznaczył(a) istotne terminy w swoim korpusie – tym razem za pomocą tf-idf z biblioteki gensim. Masz dostęp do tych samych obiektów dictionary, corpus i doc, które utworzyłeś(aś) w poprzednich ćwiczeniach. Czy tf-idf da ciekawsze wyniki na poziomie dokumentu?

TfidfModel został już zaimportowany z gensim.models.tfidfmodel.

Instrukcje 1/2

undefined XP
    1
    2
  • Zainicjuj nowy obiekt TfidfModel o nazwie tfidf, używając corpus.
  • Oblicz wagi dla doc, przekazując [doc] do tfidf.
  • Wyświetl pięć pierwszych identyfikatorów termów wraz z wagami.