1. 학습
  2. /
  3. 강의
  4. /
  5. R을 활용한 감성 분석

Connected

연습 문제

기본 극성 빠르게 살펴보기

감성 분석 프로젝트를 시작할 때, polarity()를 간단히 실행해 보면 기대치를 설정하거나 문제를 파악하는 데 도움이 됩니다. 이번 연습 문제에서는 시간을 절약하기 위해 comments 벡터의 일부에만 polarity()를 적용하고, 더 큰 극성 객체는 백그라운드에서 불러오도록 합니다.

커널 밀도 플롯을 살펴보면 리뷰가 0을 중심으로 분포하지 않는다는 것을 알 수 있습니다. 이러한 감성 "점수 인플레이션"에는 주로 두 가지 원인이 있습니다. 첫째, 사회적 규범으로 인해 응답자들이 중립적이기보다는 긍정적으로 표현하는 경향이 있습니다. 물론 이는 채널에 따라 다릅니다. e스포츠나 소셜 미디어 게시물처럼 비판적인 성향이 강한 채널은 오히려 부정적으로 치우쳐 "점수 디플레이션"이 나타날 수 있으며, 채널마다 기대 수준이 다릅니다. 둘째, "기능 기반 감성"이 원인일 수 있습니다. 일부 리뷰에서는 "침대는 편안하고 좋았지만 주방은 더럽고 지저분했다"와 같이 여러 항목의 감성이 동시에 담겨 있어 평균 점수가 왜곡될 수 있습니다.

이후 연습 문제에서는 이 "점수 인플레이션"을 조정할 예정입니다. 지금은 아무런 수정 없이 리뷰를 그대로 살펴보세요.

지침

100 XP
  • bos_reviews$comments[1:6]처럼 처음 6개 리뷰에 polarity()를 적용하여 practice_pol을 생성하세요.
  • practice_pol을 호출하여 반환된 극성 객체를 확인하세요.
  • practice_pol$all$polarity에 summary()를 호출하세요. 이렇게 하면 6개 댓글 전체의 극성을 확인할 수 있습니다.
  • 1,000개 댓글 전체에 대한 더 큰 극성 객체도 불러와 두었습니다. 이 새로운 객체는 bos_pol입니다. 이제 bos_pol의 모든 극성 점수를 반환하는 리스트 요소에 summary()를 적용하세요.
  • 샘플 코드에는 막대 플롯과 커널 밀도 플롯이 거의 완성되어 있습니다. 모든 점수를 나타내는 데이터 프레임을 입력해야 합니다. 힌트: 이전 단계에서 polarity는 이 데이터 프레임의 열(column)입니다.