1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 NLP 피처 엔지니어링

Connected

Exercise

n-gram 모델 성능 비교

이제 텍스트를 다양한 n-gram 표현으로 변환해 분류기에 입력하여 감성 분석을 수행하는 방법을 배웠습니다. 이 연습 문제에서는 이전과 같은 영화 리뷰 데이터에 대해 두 가지 n-gram 모델(유니그램과 n=3까지의 n-gram)을 사용해 감성 분석을 진행하겠습니다.

이후 세 가지 기준으로 성능을 비교합니다: 테스트 세트에서의 모델 정확도, 프로그램 실행에 걸린 시간, 그리고 n-gram 표현을 생성할 때 만들어지는 특성(feature) 수입니다.

Instrukcje 1 / 2

undefined XP
  • 1

    유니그램을 생성하도록 CountVectorizer 객체를 초기화하세요.

  • 2

    n=3까지의 n-gram을 생성하도록 CountVectorizer 객체를 초기화하세요.