BaşlayınÜcretsiz Başlayın

Basit bir kelime bulutu

Bu noktada kahveyi fazla kaçırdın. Üstelik en sık geçen kelimeler arasında "shop", "morning" ve "drinking" gibi örnekleri görmek pek de aydınlatıcı değil.

Buraya kadar geldiğini kutlamak için, hadi 1000 tweetlik başka bir partiyle devam edelim. Şimdilik ortak noktalarının ne olduğunu bilmeyeceksin; ama bir kelime bulutu kullanarak bunu çıkarıp çıkaramayacağını görelim. Tweet'lerin terim sıklığı değerleri çalışma alanına önceden yüklendi.

Kelime bulutu, terimlerin bir görselleştirmesidir. Bir kelime bulutunda boyut genellikle sıklığa göre ölçeklenir ve bazı durumlarda renkler başka bir ölçümü gösterebilir. Şimdilik basit tutuyoruz: boyut tek tek kelime sıklığıyla ilişkili ve tek bir renk seçiyoruz.

Videoda gördüğün gibi, wordcloud() fonksiyonu şöyle çalışır:

wordcloud(words, frequencies, max.words = 500, colors = "blue")

Metin madenciliği analizlerine genellikle basit kelime bulutları da dahildir. Hatta muhtemelen fazla kullanılıyorlar; ama yine de bir metin bütününü hızlıca anlamak için faydalı olabilirler!

term_frequency çalışma alanına yüklendi.

Bu egzersiz

R ile Bag-of-Words ile Metin Madenciliği

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • wordcloud paketini yükle.
  • term_frequency içindeki ilk 10 girdiyi yazdır.
  • term_frequency üzerinde names() kullanarak terimleri çıkar. Metin vektörüne terms_vec adını ver.
  • terms_vec'i kelimeler ve term_frequency'yi değerler olarak kullanarak bir wordcloud() oluştur. max.words = 50 ve colors = "red" parametrelerini ekle.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Load wordcloud package


# Print the first 10 entries in term_frequency


# Vector of terms


# Create a word cloud for the values in word_freqs
Kodu Düzenle ve Çalıştır