1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

연습 문제

모델 구축과 평가: 영화 리뷰

이 문제에서는 movies 데이터셋을 사용해 로지스틱 회귀 모델을 구축합니다. 점수는 label 열에 저장되어 있으며, 리뷰가 긍정이면 1, 부정이면 0입니다. 텍스트 리뷰는 BOW를 사용해 수치형 열로 변환되어 있어요.

이미 분류기를 만들었지만 학습 단계에 사용한 동일한 데이터로 평가했었죠. 이제는 보지 못한 테스트 데이터셋으로 모델을 평가하세요. 테스트 세트에서 평가할 때 모델의 성능이 어떻게 바뀌나요?

지침

100 XP
  • 학습/테스트 분할에 필요한 함수를 임포트하세요.
  • 데이터의 20%를 테스트 세트로 사용하도록 지정해 학습/테스트 분할을 수행하세요.
  • 로지스틱 회귀 모델을 학습하세요.
  • 학습 데이터와 테스트 데이터에서의 모델 정확도를 출력하세요.