1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

अभ्यास

3단계: 분류기 만들기

이것은 감성 분석 예측의 마지막 단계입니다. 우리는 감성과 관련된 특징으로 데이터셋을 탐색하고 보강했으며, 이를 숫자 벡터로 변환했습니다.

이전 단계에서 구축한 데이터셋을 사용합니다. 구체적으로, 리뷰 길이에 대한 특징 1개와 Tfidf 벡터라이저로 생성한 200개의 특징이 포함되어 있습니다.

이제 로지스틱 회귀를 학습해 감성을 예측해 보세요. 데이터는 미리 불러와 reviews_transformed로 제공됩니다. 타깃은 score이며 이진 변수입니다: 제품 리뷰가 긍정이면 1, 그렇지 않으면 0입니다.

로지스틱 회귀 모델을 학습하고 테스트 데이터에서 성능을 평가하세요. 모델은 얼마나 잘 작동하나요?

필요한 패키지는 모두 이미 임포트되어 있습니다.

निर्देश

100 XP
  • 학습/테스트 분할을 수행하고, 테스트 데이터는 20%로 할당하며 랜덤 시드는 456으로 설정하세요.
  • 로지스틱 회귀 모델을 학습하세요.
  • 클래스를 예측하세요.
  • 테스트 세트에 대한 정확도와 혼동 행렬을 출력하세요.