1. Учиться
  2. /
  3. Courses
  4. /
  5. Rで学ぶBag-of-Wordsによるテキストマイニング

Connected

Exercise

qdap でクリーニング

qdap パッケージには、他にもテキストをクリーンアップする関数があります。どれも用途に応じて便利で、組み合わせると特に強力です。

  • bracketX(): かっこ内のテキストをすべて削除します(例: "It's (so) cool" → "It's cool")
  • replace_number(): 数字を単語表記に置き換えます(例: "2" → "two")
  • replace_abbreviation(): 略語を正式な表記に置き換えます(例: "Sr" → "Senior")
  • replace_contraction(): 短縮形を元の語に戻します(例: "shouldn't" → "should not")
  • replace_symbol(): よく使われる記号を単語表記に置き換えます(例: "$" → "dollar")

Инструкции

100 XP

前の演習で使った text オブジェクトに、次の関数を適用してください。

  • bracketX()
  • replace_number()
  • replace_abbreviation()
  • replace_contraction()
  • replace_symbol()