1. Learn
  2. /
  3. Courses
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

Exercise

Modele n-gramów dla tagline'ów filmowych

W tym ćwiczeniu masz do dyspozycji corpus zawierający ponad 9000 tagline'ów filmowych. Twoim zadaniem jest wygenerowanie modeli n-gramów dla n=1, n=2 oraz n=3 i sprawdzenie, ile cech zawiera każdy z modeli.

Na koniec porównasz liczbę cech wygenerowanych przez poszczególne modele.

Instructions

100 XP
  • Wygeneruj model n-gramów dla n-gramów do n=1. Nazwij go ng1.
  • Wygeneruj model n-gramów dla n-gramów do n=2. Nazwij go ng2.
  • Wygeneruj model n-gramów dla n-gramów do n=3. Nazwij go ng3.
  • Wyświetl liczbę cech dla każdego modelu.