1. 학습
  2. /
  3. 강의
  4. /
  5. R로 시작하는 텍스트 분석

Connected

연습 문제

사용자 유형 세기

범주형 데이터에서 개수 세기는 핵심 요약 방법이에요. 텍스트도 범주형이므로, 개수를 계산하는 데 익숙해지는 것이 중요합니다. twitter_data에는 complaint_label 열로 표시된 불만 트윗과 비불만 트윗이 있으며, 사용자가 인증되었는지(즉, Twitter가 본인임을 확인했는지)를 나타내는 usr_verified 열도 포함되어 있어요. 이 열의 자료형은 <lgl>로, 논리형입니다. 인증된 사용자가 더 많이 불만을 제기할까요?

지침

100 XP
  • dplyr와 ggplot2가 포함된 tidyverse 패키지를 불러오세요.
  • 데이터에서 불만 트윗만 남기도록 필터링하세요.
  • 불만을 제기한 인증 사용자와 비인증 사용자의 수를 세세요.