1. 학습
  2. /
  3. 강의
  4. /
  5. R로 시작하는 텍스트 분석

Connected

연습 문제

그룹별 요약

twitter_data에는 불만 트윗보다 일반 트윗이 더 많네요. 이 데이터가 정말 Twitter에서 온 게 맞는지 살짝 의문이 들 수도 있겠어요! 트윗 본문을 보기 전에 살펴보면 좋은 열이 몇 가지 더 있습니다. 각 트윗에는 해당 사용자의 팔로워 수가 usr_followers_count 열에 포함돼 있어요. 불만을 제기한 사용자가 평균적으로 불만을 제기하지 않은 사용자보다 팔로워가 더 많을까요, 적을까요? 그룹별 요약을 사용하면 이에 대한 답을 빠르고 쉽게 확인할 수 있습니다.

지침

100 XP
  • complaint_label로 데이터를 그룹화하세요.
  • usr_followers_count의 평균, 최솟값, 최댓값을 계산하세요.