1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

Exercise

영화 리뷰의 어휘집 크기

이 연습 문제에서는 movies 리뷰 데이터셋의 샘플을 사용해 어휘집 크기를 제한하는 다양한 방법을 연습해 봅니다. 첫 번째 열은 object 타입의 review이고, 두 번째 열은 label로, 부정 리뷰는 0, 긍정 리뷰는 1입니다.

여러분이 사용할 세 가지 방법은 텍스트 열을 새로운 수치형 열로 변환하여 각 리뷰에서 단어 또는 어구의 등장 횟수를 담습니다. 각 방법은 최종적으로 만들어지는 새 특성의 개수가 서로 다르게 됩니다.

Instrukcje 1 / 3

undefined XP
  • 1

    movies 데이터셋을 사용해 어휘집 크기를 100으로 제한하세요.

  • 2

    movies 데이터셋을 사용해, 200개 이하의 문서에서 등장하는 용어만 포함하도록 어휘집 크기를 제한하세요.

  • 3

    movies 데이터셋을 사용해, 50개 미만의 문서에서 등장하는 용어는 무시하도록 어휘집 크기를 제한하세요.