1. 학습
  2. /
  3. 강의
  4. /
  5. R을 활용한 감성 분석

Connected

연습 문제

작성자 노력 평가하기

일반적으로 작성자는 감정이 강할수록 더 많은 단어를 사용하는 경향이 있습니다. 예를 들어, 서비스에 불만을 느낀 항공 승객은 불만이 클수록 더 긴 리뷰를 남기는 반면, 감정이 덜한 승객은 리뷰 작성에 많은 시간을 쏟지 않을 수 있습니다. 긴 리뷰는 자연스럽게 더 많은 긍정적 또는 부정적 표현을 포함하게 되므로, 전체 감성 점수를 왜곡할 수 있습니다. 이 코딩 실습에서는 리뷰 작성 노력과 감성의 관계를 살펴봅니다.

이 실습에서는 작성 노력과 감성 사이의 관계를 시각화합니다. 숙소 리뷰 티블(tibble)에는 id가 포함되어 있으며, 각 행은 하나의 단어를 나타냅니다. 따라서 id를 기준으로 count()를 호출하면 각 리뷰에 사용된 단어 수를 구할 수 있습니다. 이 요약 데이터를 긍정·부정 데이터와 결합한 뒤, 리뷰 길이와 극성(polarity)의 관계를 산점도로 시각화합니다.

지침 1/2

undefined XP
    1
    2
  • id의 개수를 세어 작성 노력의 지표를 계산하세요.
  • 각 리뷰의 극성 데이터인 pos_neg와 내부 조인(inner join)하세요.
  • mutate를 사용하여 pol 열을 추가하세요. ifelse()를 이용해 polarity가 0 이상이면 "Positive", 그렇지 않으면 "Negative"로 설정하세요.