MulaiMulai sekarang secara gratis

Pembersihan dengan qdap

Paket qdap menyediakan fungsi pembersihan teks lainnya. Masing-masing berguna dengan caranya sendiri dan menjadi sangat kuat ketika dikombinasikan satu sama lain.

  • bracketX(): Menghapus semua teks di dalam tanda kurung (mis. "It's (so) cool" menjadi "It's cool")
  • replace_number(): Mengganti angka dengan padanan katanya (mis. "2" menjadi "two")
  • replace_abbreviation(): Mengganti singkatan dengan bentuk lengkapnya (mis. "Sr" menjadi "Senior")
  • replace_contraction(): Mengonversi kontraksi kembali ke kata dasarnya (mis. "shouldn't" menjadi "should not")
  • replace_symbol(): Mengganti simbol umum dengan padanan katanya (mis. "$" menjadi "dollar")

Latihan ini adalah bagian dari kursus

Text Mining dengan Bag-of-Words di R

Lihat Kursus

Petunjuk latihan

Terapkan fungsi-fungsi berikut pada objek text dari latihan sebelumnya:

  • bracketX()
  • replace_number()
  • replace_abbreviation()
  • replace_contraction()
  • replace_symbol()

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

## text is still loaded in your workspace

# Remove text within brackets
___

# Replace numbers with words
___

# Replace abbreviations
___

# Replace contractions
___

# Replace symbols with words
___
Edit dan Jalankan Kode