1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶソーシャルメディアデータ分析

Connected

Exercise

URL と英字以外の文字を取り除く

Twitter ユーザーが投稿するツイートのテキストは、非構造でノイズが多く、生の状態です。

絵文字、URL、数字などが含まれます。信頼できる結果を得るには、分析前にこうした余分な情報をクリーンにする必要があります。

この演習では、URL を削除し、英字以外の文字をスペースに置き換えます。

"telemedicine" に関する 1000 件のツイートを含むツイートのデータフレーム twt_telmed は、あらかじめ読み込まれています。

この演習では、ライブラリ qdapRegex もあらかじめ読み込まれています。

Instructions 1/3

undefined XP
    1
    2
    3
  • 事前に読み込まれているデータセット twt_telmed からツイート本文を抽出します。