MulaiMulai sekarang secara gratis

Bangun korpus dan ubah menjadi huruf kecil

Korpus adalah daftar dokumen teks. Anda harus mengonversi teks tweet menjadi korpus untuk memudahkan langkah-langkah pemrosesan teks berikutnya.

Saat menganalisis teks, Anda perlu memastikan sebuah kata tidak dihitung sebagai dua kata berbeda hanya karena perbedaan huruf besar-kecil pada dua kemunculannya. Oleh karena itu, Anda perlu mengubah teks menjadi huruf kecil.

Pada latihan ini, Anda akan membuat korpus teks dan mengonversi semua karakter menjadi huruf kecil.

Keluaran teks yang telah dibersihkan dari latihan sebelumnya telah dimuat sebagai twts_gsub.

Pustaka tm telah dimuat untuk latihan ini.

Latihan ini adalah bagian dari kursus

Menganalisis Data Media Sosial dengan R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Convert text in "twt_gsub" dataset to a text corpus and view output
twt_corpus <- twt_gsub %>% 
                ___() %>% 
                ___() 
head(twt_corpus$___)
Edit dan Jalankan Kode