Membuat DTM
Buat document term matrix (DTM) menggunakan data tidy_twitter. Dalam kasus ini, setiap tweet dianggap sebagai sebuah dokumen. Cetak tidy_twitter di konsol untuk memastikan nama kolomnya.
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Mulailah dengan data Twitter yang sudah ditata.
- Hitung setiap kata yang digunakan dalam setiap tweet.
- Gunakan jumlah kata per tweet untuk membuat DTM.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Start with the tidied Twitter data
___ %>%
# Count each word used in each tweet
___(word, ___) %>%
# Use the word counts by tweet to create a DTM
cast_dtm(___, word, n)