1. Learn
  2. /
  3. कोर्स
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

अभ्यास

Porównanie wydajności modeli n-gram

Wiesz już, jak przeprowadzać analizę wydźwięku (sentiment analysis), przekształcając tekst w różne reprezentacje n-gramowe i przekazując je do klasyfikatora. W tym ćwiczeniu przeprowadzimy analizę wydźwięku na tych samych recenzjach filmowych co wcześniej, używając dwóch modeli n-gramowych: unigramów oraz n-gramów dla n równego maksymalnie 3.

Następnie porównamy wyniki według trzech kryteriów: dokładności modelu na zbiorze testowym, czasu wykonania programu oraz liczby cech utworzonych podczas generowania reprezentacji n-gramowej.

निर्देश 1/2

undefined XP
  • 1

    Utwórz obiekt CountVectorizer tak, aby generował unigramy.

  • 2

    Utwórz obiekt CountVectorizer tak, aby generował n-gramy dla n równego maksymalnie 3.