1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶソーシャルメディアデータ分析

Connected

演習

コーパスを作成して小文字に変換する

コーパスは、テキストドキュメントの一覧です。ツイートのテキストをコーパスに変換しておくと、その後のテキスト処理がしやすくなります。

テキストを分析する際は、大文字・小文字の違いで同じ単語が別の単語として数えられないようにすることが重要です。そのため、テキストを小文字に統一します。

この演習では、テキストコーパスを作成し、すべての文字を小文字に変換します。

前の演習でクリーニングしたテキストの出力は twts_gsub として読み込まれています。

この演習ではライブラリ tm があらかじめ読み込まれています。

指示1 / 2

undefined XP
    1
    2
  • twt_gsub データフレーム内のテキストをテキストコーパスに変換します。