Basit bir kelime bulutu
Bu noktada kahveyi fazla kaçırdın. Üstelik en sık geçen kelimeler arasında "shop", "morning" ve "drinking" gibi örnekleri görmek pek de aydınlatıcı değil.
Buraya kadar geldiğini kutlamak için, hadi 1000 tweetlik başka bir partiyle devam edelim. Şimdilik ortak noktalarının ne olduğunu bilmeyeceksin; ama bir kelime bulutu kullanarak bunu çıkarıp çıkaramayacağını görelim. Tweet'lerin terim sıklığı değerleri çalışma alanına önceden yüklendi.
Kelime bulutu, terimlerin bir görselleştirmesidir. Bir kelime bulutunda boyut genellikle sıklığa göre ölçeklenir ve bazı durumlarda renkler başka bir ölçümü gösterebilir. Şimdilik basit tutuyoruz: boyut tek tek kelime sıklığıyla ilişkili ve tek bir renk seçiyoruz.
Videoda gördüğün gibi, wordcloud() fonksiyonu şöyle çalışır:
wordcloud(words, frequencies, max.words = 500, colors = "blue")
Metin madenciliği analizlerine genellikle basit kelime bulutları da dahildir. Hatta muhtemelen fazla kullanılıyorlar; ama yine de bir metin bütününü hızlıca anlamak için faydalı olabilirler!
term_frequency çalışma alanına yüklendi.
Bu egzersiz
R ile Bag-of-Words ile Metin Madenciliği
kursunun bir parçasıdırEgzersiz talimatları
wordcloudpaketini yükle.term_frequencyiçindeki ilk 10 girdiyi yazdır.term_frequencyüzerindenames()kullanarak terimleri çıkar. Metin vektörüneterms_vecadını ver.terms_vec'i kelimeler veterm_frequency'yi değerler olarak kullanarak birwordcloud()oluştur.max.words = 50vecolors = "red"parametrelerini ekle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load wordcloud package
# Print the first 10 entries in term_frequency
# Vector of terms
# Create a word cloud for the values in word_freqs