1. 학습
  2. /
  3. 강의
  4. /
  5. Feature Engineering for NLP in Python

Connected

연습 문제

Porovnání výkonu n-gramových modelů

Teď už víš, jak provádět analýzu sentimentu tak, že převedeš text do různých n-gramových reprezentací a předáš je klasifikátoru. V tomto cvičení provedeme analýzu sentimentu pro stejné filmové recenze jako předtím, tentokrát pomocí dvou n-gramových modelů: unigramů a n-gramů až do n rovného 3.

Následně porovnáme výkon podle tří kritérií: přesnost modelu na testovací sadě, čas potřebný ke spuštění programu a počet příznaků vzniklých při generování n-gramové reprezentace.

지침 1/2

undefined XP
  • 1

    Inicializuj objekt CountVectorizer tak, aby generoval unigramy.

  • 2

    Inicializuj objekt CountVectorizer tak, aby generoval n-gramy až do n=3.