Daha iyi kelime bulutunu çiz
Ek durak kelimeleri kaldırdığına göre, şimdi geliştirilmiş kelime bulutuna bakalım!
Önceki egzersizdeki terim-belge matrisi as.matrix() ile matrise dönüştürüldü, ardından rowSums() ile adlandırılmış bir vektör oluşturuldu. Terim frekanslarını içeren ve chardonnay_words adı verilen bu yeni nesne çalışma alanına önceden yüklendi. Hadi bu yeni kelime bulutu sonuçlarına göz atalım.
Bu egzersiz
R ile Bag-of-Words ile Metin Madenciliği
kursunun bir parçasıdırEgzersiz talimatları
Gerekli tüm egzersizlerde olduğu gibi wordcloud paketini senin için arka planda yükledik.
chardonnay_wordsiçindeki değerleridecreasing = TRUEile sırala.sorted_chardonnay_wordsolarak kaydet.sorted_chardonnay_wordsiçindeki en üst 6 kelimeye ve değerlerine bak.chardonnay_wordsüzerindenames()kullanarakterms_vecoluştur.terms_vecvechardonnay_wordsöğeleriniwordcloud()fonksiyonuna aktar. "chardonnay" kaldırıldığında şimdi hangi başka kelimelerin öne çıktığını incele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Sort the chardonnay_words in descending order
___ <- ___(___, ___)
# Print the 6 most frequent chardonnay terms
___(___)
# Get a terms vector
___ <- ___(___)
# Create a wordcloud for the values in word_freqs
wordcloud(___, ___,
max.words = 50, colors = "red")