1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Natural Language Processing (NLP)

Connected

연습 문제

BoW와 TF-IDF 표현 비교

당신은 웨어러블 기술 회사의 분석팀 일원입니다. 목표는 제품 관리자들이 신제품 스마트워치에 대한 고객 피드백을 이해하도록 돕는 것입니다. 텍스트는 이미 전처리했고, 두 가지 표현을 만들었습니다: CountVectorizer()로 만든 bow_matrix, 그리고 TfidfVectorizer()로 만든 tfidf_matrix입니다. 이 연습 문제에서는 두 표현을 시각화해 비교하면서, 각각이 단어 중요도를 어떻게 포착하는지 살펴보겠습니다.

지침 1/2

undefined XP
  • 1
    • 제공된 bow_matrix로 DataFrame을 만들고, 각 리뷰의 단어 빈도를 시각화하는 히트맵을 그리세요.
  • 2
    • tfidf_matrix로 DataFrame을 만들고, TF-IDF 점수를 시각화하는 히트맵을 그리세요.