BaşlayınÜcretsiz başlayın

LDA sonuçlarını gözden geçirme

Ana karakter Napoleon’a atıfta bulunan Animal Farm cümleleri için 5 konulu bir konu modeli (napoleon_model) geliştirdin. Her konu için en üst kelimeleri ve en üst cümleleri 5 yerel yazar inceledi ve her konuya yönelik temalar sağladı.

Sonuçlarını tamamlamak için konular hakkında bazı özet istatistikler hazırla. Bu özet değerleri temalarla birlikte yöneticine inceleme için sunacaksın.

Bu egzersiz, kursun bir parçasıdır

R ile Doğal Dil İşlemeye Giriş

Kursa Göz Atın

Egzersiz talimatları

  • napoleon_model konu modelinden gamma matrisini çıkar.
  • Her cümledeki en baskın konuyu içeren, grouped_gammas adlı bir tibble oluşturmak için dplyr fonksiyonlarını kullan.
  • Her konuya en çok benzeyen cümle sayısını hesaplamak için grouped_gammas’ı kullan.
  • grouped_gammas’ı kullanarak her konu için ortalama gamma değerini hesapla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Extract the gamma matrix 
gamma_values <- tidy(___, matrix = ___)
# Create grouped gamma tibble
grouped_gammas <- gamma_values %>%
  ___(document) %>%
  ___(desc(gamma)) %>%
  ___(1) %>%
  ___(topic)
# Count (tally) by topic
grouped_gammas %>% 
  ___(topic, sort=TRUE)
# Average topic weight for top topic for each sentence
grouped_gammas %>% 
  ___(avg=mean(gamma)) %>%
  ___(desc(avg))
Kodu Düzenle ve Çalıştır