1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do zpracování přirozeného jazyka v Pythonu

Connected

cvičení

Tf-idf s Wikipedií

Teď je řada na tobě – zkus pomocí gensim's tf-idf určit nejvýznamnější termíny ve svém korpusu. Budeš mít opět přístup ke stejným objektům korpusu a slovníku, které jsi vytvořil/a v předchozích cvičeních – dictionary, corpus a doc. Přinese tf-idf zajímavější výsledky na úrovni dokumentu?

TfidfModel byl za tebe naimportován z gensim.models.tfidfmodel.

Pokyny 1/2

undefined XP
    1
    2
  • Inicializuj nový TfidfModel s názvem tfidf pomocí corpus.
  • Pomocí doc vypočítej váhy – předej [doc] do tfidf.
  • Vypiš prvních pět ID termínů spolu s jejich vahami.