1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering for NLP in Python

Connected

cvičení

N-gramové modely pro filmové slogany

V tomto cvičení máš k dispozici corpus s více než 9 000 filmovými slogany. Tvým úkolem je pro tato data vytvořit n-gramové modely pro n rovné 1, n rovné 2 a n rovné 3 a zjistit počet příznaků každého modelu.

Poté porovnáš počty příznaků vygenerovaných jednotlivými modely.

Pokyny

100 XP
  • Vytvoř n-gramový model s n-gramy pro n=1. Pojmenuj ho ng1.
  • Vytvoř n-gramový model s n-gramy pro n=2. Pojmenuj ho ng2.
  • Vytvoř n-gramový model s n-gramy pro n=3. Pojmenuj ho ng3.
  • Vypiš počet příznaků pro každý model.