1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Natural Language Processing (NLP)

Connected

Exercises

상품 리뷰의 빈도 분석

이제 더 큰 TechZone 상품 리뷰 데이터셋을 사용할 수 있어요. 이전과 마찬가지로 리뷰를 전처리하고 BoW 표현 X로 변환해 두었습니다. 이번 과제는 단어 빈도를 분석해 데이터셋에서 가장 흔한 용어들을 찾아내는 것입니다.

분석에 도움이 되도록 get_top_ten()이라는 보조 함수가 제공됩니다. 이 함수는 단어 목록과 해당 빈도를 입력으로 받아, 가장 자주 등장하는 10개 단어와 그 빈도를 반환합니다.

คำแนะนำ 1 / 2

undefined XP
    1
    2
  • 모든 리뷰에 걸친 각 단어의 총계를 나타내는 word_counts를 구하세요.
  • vectorizer가 학습한 고유 words 목록을 가져오세요.