Bir DTM Oluşturma
tidy_twitter verimizi kullanarak bir doküman-terim matrisi (DTM) oluştur. Bu senaryoda, her tweet bir doküman olarak kabul edilir. Sütun adlarını doğrulamak için konsolda tidy_twitter'ı yazdır.
Bu egzersiz
R ile Metin Analizine Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Düzenlenmiş Twitter verisiyle başla.
- Her tweette kullanılan her kelimeyi say.
- Tweet başına kelime sayımlarını kullanarak bir DTM oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Start with the tidied Twitter data
___ %>%
# Count each word used in each tweet
___(word, ___) %>%
# Use the word counts by tweet to create a DTM
cast_dtm(___, word, n)