MulaiMulai sekarang secara gratis

Hapus URL dan karakter selain huruf

Teks tweet yang diposting oleh pengguna Twitter tidak terstruktur, bising, dan mentah.

Teks tersebut berisi emotikon, URL, dan angka. Informasi yang tidak relevan ini perlu dibersihkan sebelum analisis agar menghasilkan temuan yang andal.

Dalam latihan ini, Anda akan menghapus URL dan mengganti karakter selain huruf dengan spasi.

Kerangka data tweet twt_telmed, dengan 1000 tweet tentang "telemedicine", telah dimuat sebelumnya untuk latihan ini.

Pustaka qdapRegex telah dimuat sebelumnya untuk latihan ini.

Latihan ini adalah bagian dari kursus

Menganalisis Data Media Sosial dengan R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Extract tweet text from the pre-loaded dataset
twt_txt <- ___$___
head(twt_txt)
Edit dan Jalankan Kode