Membuat DTM
Buat document term matrix (DTM) menggunakan data tidy_twitter. Dalam kasus ini, setiap tweet dianggap sebagai sebuah dokumen. Cetak tidy_twitter di konsol untuk memastikan nama kolomnya.
Latihan ini merupakan bagian dari kursus
Pengantar Analisis Teks di R
Instruksi latihan
- Mulailah dengan data Twitter yang sudah ditata.
- Hitung setiap kata yang digunakan dalam setiap tweet.
- Gunakan jumlah kata per tweet untuk membuat DTM.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Start with the tidied Twitter data
___ %>%
# Count each word used in each tweet
___(word, ___) %>%
# Use the word counts by tweet to create a DTM
cast_dtm(___, word, n)