1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. R로 소셜 미디어 데이터 분석하기

Connected

Exercises

URL과 문자 이외의 기호 제거하기

트위터 사용자가 올린 트윗 텍스트는 구조화되지 않고, 잡음이 많으며, 전처리가 필요합니다.

이 텍스트에는 이모티콘, URL, 숫자 등이 포함됩니다. 신뢰할 수 있는 분석 결과를 얻으려면 이러한 불필요한 정보를 먼저 정리해야 합니다.

이번 연습에서는 URL을 제거하고, 알파벳이 아닌 문자를 공백으로 대체해 보겠습니다.

"telemedicine" 관련 트윗 1000건이 담긴 트윗 데이터 프레임 twt_telmed가 미리 로드되어 있습니다.

또한 qdapRegex 패키지도 미리 로드되어 있습니다.

คำแนะนำ 1 / 3

undefined XP
    1
    2
    3
  • 미리 로드된 twt_telmed 데이터셋에서 트윗 텍스트를 추출하세요.