1. 学ぶ
  2. /
  3. コース
  4. /
  5. R로 소셜 미디어 데이터 분석하기

Connected

演習

코퍼스 생성 및 소문자로 변환하기

코퍼스(corpus)는 텍스트 문서의 목록입니다. 이후 텍스트 처리를 쉽게 하기 위해 트윗 텍스트를 코퍼스로 변환해야 합니다.

텍스트를 분석할 때는 같은 단어가 대소문자 차이로 다른 단어로 집계되지 않도록 하는 것이 중요합니다. 따라서 텍스트를 소문자로 변환해야 합니다.

이번 연습에서는 텍스트 코퍼스를 만들고 모든 문자를 소문자로 변환합니다.

이전 연습에서 정제된 텍스트 출력은 twts_gsub로 미리 로드되어 있습니다.

이번 연습에는 tm 라이브러리가 미리 로드되어 있습니다.

指示1 / 2

undefined XP
    1
    2
  • twt_gsub 데이터 프레임의 텍스트를 텍스트 코퍼스로 변환하세요.