1. 학습
  2. /
  3. 강의
  4. /
  5. R로 시작하는 텍스트 분석

Connected

연습 문제

정제와 개수 세기

twitter_data에서 불용어를 제거해, 불만으로 분류된 항공사 트윗의 실제 내용을 살펴보세요.

지침

100 XP
  • twitter_data의 트윗을 토큰화하세요. 토큰화된 단어 열 이름은 word로 지정하세요.
  • 토큰화된 twitter_data에서 기본 불용어를 제거하세요.
  • 불만에 해당하는 행만 필터링해서 남기세요.
  • 토큰화하고 정제한 텍스트로 단어 빈도를 계산하고, 개수 기준 내림차순으로 정렬하세요.