Ortak sözcükleri görselleştir
Artık hem chardonnay hem de coffee tweet dosyalarında kullanılan sözcüklerle dolu bir derlemine (corpus) sahip olduğuna göre, derlemi temizleyebilir, bir TermDocumentMatrixe ve ardından bir matrise dönüştürerek commonality.cloud() için hazırlayabilirsin.
commonality.cloud() fonksiyonu bu matris nesnesini kabul eder; ayrıca grafiği özelleştirmek için max.words ve colors gibi ek argümanlar alır.
commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")
Bu egzersiz, kursun bir parçasıdır
R ile Bag-of-Words ile Metin Madenciliği
Egzersiz talimatları
- Tanımlı
clean_corpus()fonksiyonunuall_corpusüzerine uygulayarakall_cleanoluştur. all_cleanden birTermDocumentMatrixolanall_tdmyi oluştur.all_tdmyi bir matris nesnesine dönüştürerekall_myi oluştur.all_mdenmax.words = 100vecolors = "steelblue1"ile bircommonality.cloud()oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Clean the corpus
___ <- ___(___)
# Create all_tdm
___ <- ___(___)
# Create all_m
___ <- ___(___)
# Print a commonality cloud
___(___, ___, ___)