1. Învăţa
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

exercise

2단계: 벡터라이저 만들기

이 연습에서는 reviews 데이터셋의 review 열에 대해 TfIDf 변환을 구축해 보겠습니다. n-그램, 불용어, 토큰 패턴, vocabulary 크기 인자를 직접 지정해 주세요.

이제 리뷰의 감성을 예측할 분류기를 학습하기 직전 마지막 단계예요.

특징의 최대 개수를 적절히 설정해 주세요. vocabulary 크기가 지나치게 크면 세션이 끊길 수 있어요.

Instrucţiuni

100 XP
  • Tfidf 벡터라이저와 영어 불용어 기본 목록을 임포트하세요.
  • 다음 인자를 이 순서대로 지정하여 Tfidf 벡터라이저를 구성하세요: 불용어로 영어 기본 목록 사용; n-그램은 유니그램과 바이그램 사용; 최대 특징 개수는 200; 지정된 패턴을 사용해 단어만 캡처.
  • Tfidf 벡터라이저를 사용하여 DataFrame을 생성하세요.