1. 학습
  2. /
  3. 강의
  4. /
  5. R을 활용한 감성 분석

Connected

연습 문제

이 노래 완전 최고야

Zipf의 법칙이 적용되더라도, 텍스트 출처(예: 트위터 vs. 법률 문서)나 작성자의 인구통계적 특성(예: 10대 vs. 노년층)에 맞게 어휘 사전을 조정해야 할 경우가 생깁니다. 이번 연습 문제에서는 필요할 때 수정할 수 있도록 polarity()의 구성 요소들을 직접 살펴봅니다.

Trey Songz의 "Lol :)"에는 "LOL smiley face, LOL smiley face."라는 가사가 있습니다. 기본 polarity() 함수에서는 "LOL"이 긍정 단어로 정의되어 있지 않습니다. 하지만 "LOL"은 "Laugh Out Loud"의 줄임말로, 긍정적인 의미를 가집니다. 따라서 팝 문화 속어가 포함된 텍스트의 맥락에 맞게 어휘 사전을 조정해야 합니다. 분석 대상 텍스트가 특정 채널(트위터의 "LOL"), 지역(보스턴의 "Wicked Good"), 또는 연령대(10대의 "sick")에서 나온 경우, 어휘 사전 조정이 필요할 수 있습니다.

이번 연습 문제에서는 주관성 어휘 사전이나 감정 변환어가 포함된 qdap 사전을 직접 수정하지는 않습니다. 대신, 다음 연습 문제에서 수정할 수 있도록 기존 단어 데이터 프레임 객체들을 살펴봅니다.

연습 문제를 위해 비욘세의 "Crazy in Love" 가사 중 두 구절을 담은 text를 미리 생성해 두었습니다.

지침 1/2

undefined XP
    1
    2
  • key.pol을 출력하여 주관성 단어와 값의 일부를 확인하세요.
  • 미리 정의된 negation.words를 살펴보고 모든 부정 표현을 출력하세요.
  • amplification.words를 출력하여 어휘 사전 값을 증폭시키는 단어들을 확인하세요.
  • deamplification.words를 확인하여 어휘 사전 값을 감소시키는 단어들을 출력하세요.
  • text를 호출하여 대화 내용을 확인하세요.