Pembersihan dengan qdap
Paket qdap menyediakan fungsi pembersihan teks lainnya. Masing-masing berguna dengan caranya sendiri dan menjadi sangat kuat ketika dikombinasikan satu sama lain.
bracketX(): Menghapus semua teks di dalam tanda kurung (mis. "It's (so) cool" menjadi "It's cool")replace_number(): Mengganti angka dengan padanan katanya (mis. "2" menjadi "two")replace_abbreviation(): Mengganti singkatan dengan bentuk lengkapnya (mis. "Sr" menjadi "Senior")replace_contraction(): Mengonversi kontraksi kembali ke kata dasarnya (mis. "shouldn't" menjadi "should not")replace_symbol(): Mengganti simbol umum dengan padanan katanya (mis. "$" menjadi "dollar")
Latihan ini adalah bagian dari kursus
Text Mining dengan Bag-of-Words di R
Petunjuk latihan
Terapkan fungsi-fungsi berikut pada objek text dari latihan sebelumnya:
bracketX()replace_number()replace_abbreviation()replace_contraction()replace_symbol()
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
## text is still loaded in your workspace
# Remove text within brackets
___
# Replace numbers with words
___
# Replace abbreviations
___
# Replace contractions
___
# Replace symbols with words
___