1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

연습 문제

트윗에서 뽑은 어간(stem)

이 연습 문제에서는 tweets라는 배열을 사용합니다. 이 배열에는 Twitter에서 수집한 항공사 감성 데이터의 텍스트가 들어 있어요.

여러분의 과제는 이 배열을 리스트 컴프리헨션으로 토큰 리스트로 변환하는 것입니다. 그다음, 토큰 리스트를 순회하면서 각 토큰의 어간을 만들어 보세요. 리스트 컴프리헨션은 for 루프를 한 줄로 대체하는 방법이라는 점을 기억하세요.

지침

100 XP
  • 문자열을 어간으로 변환하는 데 사용하는 함수를 import 하세요.
  • 방금 import 한 Porter stemmer 함수를 호출하세요.
  • 리스트 컴프리헨션을 사용해 tokens 리스트를 만드세요. 이 리스트에는 tweets 배열의 모든 단어 토큰이 들어 있어야 합니다.
  • tokens 리스트를 순회하며 각 항목에 어간 추출 함수를 적용하세요.