1. 학습
  2. /
  3. 강의
  4. /
  5. R을 활용한 감성 분석

Connected

연습 문제

Bing 감성 극성 분석: 흰 고래의 빈도 계산과 피벗 변환

이 연습 문제에서는 "bing" 어휘 사전을 사용하여 inner_join()을 다시 적용해 봅니다.

그런 다음 dplyr의 count()와 tidyr의 pivot_wider()를 함께 사용해 결과를 가공하고 텍스트에 대한 인사이트를 얻어 봅니다.

pivot_wider() 함수는 데이터를 여러 열에 걸쳐 넓게 펼쳐줍니다. 이 경우, 감성(sentiment)과 그에 해당하는 n 값은 각 행에서 긍정 또는 부정 단어의 빈도를 나타냅니다. pivot_wider()를 사용하면 값이 0이더라도 각 행에 긍정과 부정 값이 모두 포함되도록 데이터 구조가 변환됩니다.

지침

100 XP

이 연습 문제의 R 세션에는 모비 딕(Moby Dick) 텍스트가 담긴 m_dick_tidy와 이전 연습 문제와 유사한 어휘 사전인 bing이 준비되어 있습니다.

  • m_dick_tidy와 bing을 대상으로 inner_join()을 수행하세요.
    • 이전과 동일하게, m_dick_tidy의 "term" 열을 어휘 사전의 "word" 열에 조인하세요.
    • 새 객체의 이름은 moby_lex_words로 지정하세요.
  • document에 as.numeric()을 적용하여 index 열을 생성하세요. 이 작업은 tidyverse의 mutate() 내에서 수행합니다.
  • moby_lex_words를 count()에 전달하고 sentiment, index를 인수로 넘겨 moby_count를 생성하세요.
  • moby_count를 pivot_wider()로 파이프하여 moby_wide를 생성하세요. 이때 names_from은 sentiment 열, values_from은 n 열로 설정하고, 빈 값은 values_fill = 0으로 채우세요.
  • 마지막 파이프로 arrange를 사용하여 행을 index 값 기준으로 정렬하세요.