Twitter 데이터의 성능 지표

트윗의 감성을 예측하는 로지스틱 회귀 모델을 학습하고, 다양한 지표로 테스트 세트에서의 성능을 평가해 보세요.

행렬 X는 이미 준비되어 있습니다. text 열에 대해 BOW로 생성한 특성이 들어 있어요.

레이블은 벡터 y에 저장되어 있습니다. y는 부정 트윗은 0, 중립은 1, 긍정은 2예요. 비록 클래스가 3개지만, 여전히 분류 문제입니다. 정확도는 올바르게 예측된 사례의 비율을 측정해요. 혼동 행렬은 이제 3x3 크기이며, 각 행은 예측된 클래스 2, 1, 0의 건수를, 각 열은 실제 클래스 2, 1, 0의 건수를 나타냅니다.