BaşlayınÜcretsiz Başlayın

LDA sonuçlarını gözden geçirme

Ana karakter Napoleon’a atıfta bulunan Animal Farm cümleleri için 5 konulu bir konu modeli (napoleon_model) geliştirdin. Her konu için en üst kelimeleri ve en üst cümleleri 5 yerel yazar inceledi ve her konuya yönelik temalar sağladı.

Sonuçlarını tamamlamak için konular hakkında bazı özet istatistikler hazırla. Bu özet değerleri temalarla birlikte yöneticine inceleme için sunacaksın.

Bu egzersiz

R ile Doğal Dil İşlemeye Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • napoleon_model konu modelinden gamma matrisini çıkar.
  • Her cümledeki en baskın konuyu içeren, grouped_gammas adlı bir tibble oluşturmak için dplyr fonksiyonlarını kullan.
  • Her konuya en çok benzeyen cümle sayısını hesaplamak için grouped_gammas’ı kullan.
  • grouped_gammas’ı kullanarak her konu için ortalama gamma değerini hesapla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Extract the gamma matrix 
gamma_values <- tidy(___, matrix = ___)
# Create grouped gamma tibble
grouped_gammas <- gamma_values %>%
  ___(document) %>%
  ___(desc(gamma)) %>%
  ___(1) %>%
  ___(topic)
# Count (tally) by topic
grouped_gammas %>% 
  ___(topic, sort=TRUE)
# Average topic weight for top topic for each sentence
grouped_gammas %>% 
  ___(avg=mean(gamma)) %>%
  ___(desc(avg))
Kodu Düzenle ve Çalıştır