1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Natural Language Processing (NLP)

Connected

연습 문제

고객 리뷰로 어휘집 구축하기

여러분은 소비자 전자제품 회사인 TechZone의 제품 분석 팀에 속해 있어요. 새로운 기기에 대한 고객 리뷰가 소량 도착했습니다. 리뷰를 분석하려면 먼저 텍스트를 전처리하고, 각 리뷰를 수치 데이터로 표현할 때 사용할 특징을 정의하는 고유 단어 목록, 즉 어휘집(vocabulary)을 만들어야 합니다.

preprocess() 함수가 미리 제공되어 있어요. 이 함수는 텍스트를 소문자로 바꾸고, 토큰화하며, 문장 부호를 제거합니다.

지침

100 XP
  • 데이터셋의 각 리뷰에 preprocess() 함수를 적용해 전처리하세요.
  • 전처리된 리뷰에 vectorizer를 적합(fit)하세요.
  • 생성된 어휘집을 출력하세요.