Hapus URL dan karakter selain huruf
Teks tweet yang diposting oleh pengguna Twitter tidak terstruktur, bising, dan mentah.
Teks tersebut berisi emotikon, URL, dan angka. Informasi yang tidak relevan ini perlu dibersihkan sebelum analisis agar menghasilkan temuan yang andal.
Dalam latihan ini, Anda akan menghapus URL dan mengganti karakter selain huruf dengan spasi.
Kerangka data tweet twt_telmed, dengan 1000 tweet tentang "telemedicine", telah dimuat sebelumnya untuk latihan ini.
Pustaka qdapRegex telah dimuat sebelumnya untuk latihan ini.
Latihan ini adalah bagian dari kursus
Menganalisis Data Media Sosial dengan R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Extract tweet text from the pre-loaded dataset
twt_txt <- ___$___
head(twt_txt)