Ortak sözcükleri görselleştir
Artık hem chardonnay hem de coffee tweet dosyalarında kullanılan sözcüklerle dolu bir derlemine (corpus) sahip olduğuna göre, derlemi temizleyebilir, bir TermDocumentMatrixe ve ardından bir matrise dönüştürerek commonality.cloud() için hazırlayabilirsin.
commonality.cloud() fonksiyonu bu matris nesnesini kabul eder; ayrıca grafiği özelleştirmek için max.words ve colors gibi ek argümanlar alır.
commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")
Bu egzersiz
R ile Bag-of-Words ile Metin Madenciliği
kursunun bir parçasıdırEgzersiz talimatları
- Tanımlı
clean_corpus()fonksiyonunuall_corpusüzerine uygulayarakall_cleanoluştur. all_cleanden birTermDocumentMatrixolanall_tdmyi oluştur.all_tdmyi bir matris nesnesine dönüştürerekall_myi oluştur.all_mdenmax.words = 100vecolors = "steelblue1"ile bircommonality.cloud()oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Clean the corpus
___ <- ___(___)
# Create all_tdm
___ <- ___(___)
# Create all_m
___ <- ___(___)
# Print a commonality cloud
___(___, ___, ___)