1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

연습 문제

Twitter 데이터의 성능 지표

트윗의 감성을 예측하는 로지스틱 회귀 모델을 학습하고, 다양한 지표로 테스트 세트에서의 성능을 평가해 보세요.

행렬 X는 이미 준비되어 있습니다. text 열에 대해 BOW로 생성한 특성이 들어 있어요.

레이블은 벡터 y에 저장되어 있습니다. y는 부정 트윗은 0, 중립은 1, 긍정은 2예요. 비록 클래스가 3개지만, 여전히 분류 문제입니다. 정확도는 올바르게 예측된 사례의 비율을 측정해요. 혼동 행렬은 이제 3x3 크기이며, 각 행은 예측된 클래스 2, 1, 0의 건수를, 각 열은 실제 클래스 2, 1, 0의 건수를 나타냅니다.

필요한 패키지는 모두 가져와 두었습니다.

지침

100 XP
  • 학습/테스트 분할을 수행하고, y로 stratify하세요.
  • 로지스틱 회귀 분류기를 학습시키세요.
  • 테스트 세트에 대해 예측을 수행하세요.
  • 테스트 세트에서 얻은 정확도와 혼동 행렬을 출력하세요.