1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

Bài tập

모델 구축 및 평가: 상품 리뷰 데이터

이 연습 문제에서는 Amazon 상품에 대한 고객 리뷰가 담긴 reviews 데이터셋으로 로지스틱 회귀를 구축해 보겠습니다. 배열 y는 감성(sentiment)을 담고 있으며, 긍정이면 1, 그렇지 않으면 0입니다. 배열 X에는 BOW 방식으로 만든 모든 수치형 특성이 들어 있습니다. IPython 셸에서 자유롭게 살펴보셔도 좋아요.

여러분의 과제는 로지스틱 회귀 모델을 구축하고, 테스트 데이터셋을 사용해 정확도와 혼동 행렬을 계산하는 것입니다.

로지스틱 회귀와 학습/테스트 분할 함수는 이미 임포트되어 있습니다.

Hướng dẫn

100 XP
  • accuracy score와 confusion matrix 함수를 임포트하세요.
  • 데이터를 학습/테스트 세트로 분할하되, 30%를 테스트 세트로 사용하고 랜덤 시드는 42로 설정하세요.
  • 로지스틱 회귀 모델을 학습하세요.
  • 테스트 데이터를 사용해 정확도와 혼동 행렬을 출력하세요.