1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Natural Language Processing (NLP)

Connected

연습 문제

스테밍(Stemming)

이제 review 텍스트를 정제하고 불용어와 구두점을 제거했으니, 남은 단어들을 스테밍으로 정규화해 어근 형태로 줄여 보겠습니다. 이렇게 하면 유사한 단어를 묶어 분석을 더 일관되고 효율적으로 만들 수 있어요.

PorterStemmer 클래스와 clean_tokens 리스트가 제공되어 있습니다.

지침

100 XP
  • PorterStemmer()를 초기화하세요.
  • 리스트 컴프리헨션을 사용해 clean_tokens 리스트의 각 토큰에 스테밍을 적용하세요.