Benzeşmeyen kelimeleri görselleştir
Diyelim ki ortak olmayan kelimeleri görselleştirmek istiyorsun. Bunu yapmak için comparison.cloud() da kullanabilirsin ve adımlar, bir ana farkla, oldukça benzerdir.
Ortak kelimeleri ararken yaptığın gibi, önce tweet'leri ayrı derleklere ayırıp bunları kendi VCorpus() nesnesinde birleştirirsin. Sonra clean_corpus() fonksiyonunu uygula ve bir TermDocumentMatrix içine düzenle.
coffee ile chardonnay'ye ait kelimeleri takip etmek için TDM'in sütun adlarını şöyle ayarlayabilirsin:
colnames(all_tdm) <- c("chardonnay", "coffee")
Son olarak, comparison.cloud() içinde kullanmak üzere nesneyi as.matrix() ile bir matrise dönüştür. comparison.cloud()'a geçirilen her ayrı derlek için, bölümleri ayırt edilebilir kılmak adına colors = c("red", "yellow", "green") örneğinde olduğu gibi bir renk belirtebilirsin.
Bu egzersiz, kursun bir parçasıdır
R ile Bag-of-Words ile Metin Madenciliği
Egzersiz talimatları
all_corpus çalışma alanına önceden yüklendi.
all_corpusüzerine önceden tanımlıclean_corpusfonksiyonunu uygulayarakall_cleanoluştur.all_clean'den birTermDocumentMatrixolanall_tdmoluştur.colnames()kullanarakall_tdmiçindeki her bir ayrı derleğin adını değiştir. İlk sütunu "coffee", ikinci sütunu "chardonnay" olarak adlandır.all_tdm'yi matris biçimine dönüştürerekall_moluştur.all_mkullanarak,colors = c("orange", "blue")vemax.words = 50ile bircomparison.cloud()oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Clean the corpus
___ <- ___(___)
# Create all_tdm
___ <- ___(___)
# Give the columns distinct names
___(___) <- ___
# Create all_m
___ <- ___(___)
# Create comparison cloud
comparison.cloud(___, ___ = c("___", "___"), max.words = ___)