1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python으로 배우는 Natural Language Processing (NLP)

Connected

演習

BoW로 텍스트를 숫자로 변환하기

이제 고객 리뷰로부터 어휘집을 만들었으니, Bag-of-Words(BoW) 모델을 사용해 각 리뷰를 수치 형식으로 변환할 차례예요. 이 단계에서는 각 행이 하나의 리뷰를, 각 열이 어휘집의 단어를 나타내는 구조화된 행렬이 만들어집니다.

cleaned_reviews 리스트와 학습이 완료된 vectorizer는 미리 로드되어 있어요.

指示

100 XP
  • cleaned_reviews를 bow_matrix로 변환하세요.
  • BoW 표현을 NumPy 배열로 출력하세요.