Basit bir kelime bulutu

Bu noktada kahveyi fazla kaçırdın. Üstelik en sık geçen kelimeler arasında "shop", "morning" ve "drinking" gibi örnekleri görmek pek de aydınlatıcı değil.

Buraya kadar geldiğini kutlamak için, hadi 1000 tweetlik başka bir partiyle devam edelim. Şimdilik ortak noktalarının ne olduğunu bilmeyeceksin; ama bir kelime bulutu kullanarak bunu çıkarıp çıkaramayacağını görelim. Tweet'lerin terim sıklığı değerleri çalışma alanına önceden yüklendi.

Kelime bulutu, terimlerin bir görselleştirmesidir. Bir kelime bulutunda boyut genellikle sıklığa göre ölçeklenir ve bazı durumlarda renkler başka bir ölçümü gösterebilir. Şimdilik basit tutuyoruz: boyut tek tek kelime sıklığıyla ilişkili ve tek bir renk seçiyoruz.

Videoda gördüğün gibi, wordcloud() fonksiyonu şöyle çalışır:

wordcloud(words, frequencies, max.words = 500, colors = "blue")

Metin madenciliği analizlerine genellikle basit kelime bulutları da dahildir. Hatta muhtemelen fazla kullanılıyorlar; ama yine de bir metin bütününü hızlıca anlamak için faydalı olabilirler!

term_frequency çalışma alanına yüklendi.

Bu egzersiz, kursun bir parçasıdır

R ile Bag-of-Words ile Metin Madenciliği

Kursa Göz Atın

Egzersiz talimatları

wordcloud paketini yükle.
term_frequency içindeki ilk 10 girdiyi yazdır.
term_frequency üzerinde names() kullanarak terimleri çıkar. Metin vektörüne terms_vec adını ver.
terms_vec'i kelimeler ve term_frequency'yi değerler olarak kullanarak bir wordcloud() oluştur. max.words = 50 ve colors = "red" parametrelerini ekle.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Load wordcloud package


# Print the first 10 entries in term_frequency


# Vector of terms


# Create a word cloud for the values in word_freqs

Kodu Düzenle ve Çalıştır