1. 학습
  2. /
  3. 강의
  4. /
  5. R로 시작하는 텍스트 분석

Connected

연습 문제

항공사 트윗 데이터

twitter_data 데이터 프레임에는 항공사에 관한 트윗이 7,000개 이상 들어 있어요. 이 트윗들은 complaint_label 열에서 불만(complaint)인지 아닌지로 이미 분류되어 있습니다. 이 중 얼마나 많은 트윗이 불만인지 감을 잡아봅시다.

이 데이터는 실제 Twitter 데이터이므로, 비속어 또는 불쾌감을 줄 수 있는 표현이 포함되어 있을 수 있습니다(이번 연습 문제뿐 아니라 이후의 실제 Twitter 데이터를 사용하는 모든 연습 문제에도 해당됩니다).

지침

100 XP
  • tidyverse 패키지를 로드하세요.
  • twitter_data를 출력해 데이터의 크기와 내용을 대략 살펴보세요.
  • twitter_data에서 불만만 남도록 필터링하세요. 데이터에는 불만이 몇 건 있나요?