Benzeşmeyen kelimeleri görselleştir

Diyelim ki ortak olmayan kelimeleri görselleştirmek istiyorsun. Bunu yapmak için comparison.cloud() da kullanabilirsin ve adımlar, bir ana farkla, oldukça benzerdir.

Ortak kelimeleri ararken yaptığın gibi, önce tweet'leri ayrı derleklere ayırıp bunları kendi VCorpus() nesnesinde birleştirirsin. Sonra clean_corpus() fonksiyonunu uygula ve bir TermDocumentMatrix içine düzenle.

coffee ile chardonnay'ye ait kelimeleri takip etmek için TDM'in sütun adlarını şöyle ayarlayabilirsin:

colnames(all_tdm) <- c("chardonnay", "coffee")

Son olarak, comparison.cloud() içinde kullanmak üzere nesneyi as.matrix() ile bir matrise dönüştür. comparison.cloud()'a geçirilen her ayrı derlek için, bölümleri ayırt edilebilir kılmak adına colors = c("red", "yellow", "green") örneğinde olduğu gibi bir renk belirtebilirsin.

Bu egzersiz, kursun bir parçasıdır

R ile Bag-of-Words ile Metin Madenciliği

Kursa Göz Atın

Egzersiz talimatları

all_corpus çalışma alanına önceden yüklendi.

all_corpus üzerine önceden tanımlı clean_corpus fonksiyonunu uygulayarak all_clean oluştur.
all_clean'den bir TermDocumentMatrix olan all_tdm oluştur.
colnames() kullanarak all_tdm içindeki her bir ayrı derleğin adını değiştir. İlk sütunu "coffee", ikinci sütunu "chardonnay" olarak adlandır.
all_tdm'yi matris biçimine dönüştürerek all_m oluştur.
all_m kullanarak, colors = c("orange", "blue") ve max.words = 50 ile bir comparison.cloud() oluştur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Clean the corpus
___ <- ___(___)

# Create all_tdm
___ <- ___(___)

# Give the columns distinct names
___(___) <- ___

# Create all_m
___ <- ___(___)

# Create comparison cloud
comparison.cloud(___, ___ = c("___", "___"), max.words = ___)

Kodu Düzenle ve Çalıştır