Benzeşmeyen kelimeleri görselleştir
Diyelim ki ortak olmayan kelimeleri görselleştirmek istiyorsun. Bunu yapmak için comparison.cloud() da kullanabilirsin ve adımlar, bir ana farkla, oldukça benzerdir.
Ortak kelimeleri ararken yaptığın gibi, önce tweet'leri ayrı derleklere ayırıp bunları kendi VCorpus() nesnesinde birleştirirsin. Sonra clean_corpus() fonksiyonunu uygula ve bir TermDocumentMatrix içine düzenle.
coffee ile chardonnay'ye ait kelimeleri takip etmek için TDM'in sütun adlarını şöyle ayarlayabilirsin:
colnames(all_tdm) <- c("chardonnay", "coffee")
Son olarak, comparison.cloud() içinde kullanmak üzere nesneyi as.matrix() ile bir matrise dönüştür. comparison.cloud()'a geçirilen her ayrı derlek için, bölümleri ayırt edilebilir kılmak adına colors = c("red", "yellow", "green") örneğinde olduğu gibi bir renk belirtebilirsin.
Bu egzersiz
R ile Bag-of-Words ile Metin Madenciliği
kursunun bir parçasıdırEgzersiz talimatları
all_corpus çalışma alanına önceden yüklendi.
all_corpusüzerine önceden tanımlıclean_corpusfonksiyonunu uygulayarakall_cleanoluştur.all_clean'den birTermDocumentMatrixolanall_tdmoluştur.colnames()kullanarakall_tdmiçindeki her bir ayrı derleğin adını değiştir. İlk sütunu "coffee", ikinci sütunu "chardonnay" olarak adlandır.all_tdm'yi matris biçimine dönüştürerekall_moluştur.all_mkullanarak,colors = c("orange", "blue")vemax.words = 50ile bircomparison.cloud()oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Clean the corpus
___ <- ___(___)
# Create all_tdm
___ <- ___(___)
# Give the columns distinct names
___(___) <- ___
# Create all_m
___ <- ___(___)
# Create comparison cloud
comparison.cloud(___, ___ = c("___", "___"), max.words = ___)