LDA sonuçlarını gözden geçirme
Ana karakter Napoleon’a atıfta bulunan Animal Farm cümleleri için 5 konulu bir konu modeli (napoleon_model) geliştirdin. Her konu için en üst kelimeleri ve en üst cümleleri 5 yerel yazar inceledi ve her konuya yönelik temalar sağladı.
Sonuçlarını tamamlamak için konular hakkında bazı özet istatistikler hazırla. Bu özet değerleri temalarla birlikte yöneticine inceleme için sunacaksın.
Bu egzersiz
R ile Doğal Dil İşlemeye Giriş
kursunun bir parçasıdırEgzersiz talimatları
napoleon_modelkonu modelinden gamma matrisini çıkar.- Her cümledeki en baskın konuyu içeren,
grouped_gammasadlı bir tibble oluşturmak içindplyrfonksiyonlarını kullan. - Her konuya en çok benzeyen cümle sayısını hesaplamak için
grouped_gammas’ı kullan. grouped_gammas’ı kullanarak her konu için ortalama gamma değerini hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Extract the gamma matrix
gamma_values <- tidy(___, matrix = ___)
# Create grouped gamma tibble
grouped_gammas <- gamma_values %>%
___(document) %>%
___(desc(gamma)) %>%
___(1) %>%
___(topic)
# Count (tally) by topic
grouped_gammas %>%
___(topic, sort=TRUE)
# Average topic weight for top topic for each sentence
grouped_gammas %>%
___(avg=mean(gamma)) %>%
___(desc(avg))