Konuları belgelere atama
LDA modelleri, sonuçlarını yorumlayıp kullanamadığın sürece pek işe yaramaz. Bir dizi cümle (pig_sentences) üzerinde çalıştırılan bir LDA modelinin (sentence_lda) sonuçları sana verildi. Herhangi bir LDA analizinin sonuçlarını tam olarak anlamak için hem konu başına en iyi sözcükleri veren beta matrisini hem de belge başına en iyi konuları veren gamma matrisini incelemen gerekiyor.
Bu iki matris hakkında bildiklerine dayanarak, belirli bir konu için sonuçları çıkar ve çıktının beklentilerle uyuşup uyuşmadığına bak.
Bu egzersiz
R ile Doğal Dil İşlemeye Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Hem
betahem degammamatrisleri için birer tibble oluştur. - Sonuçları azalan
betadeğerlerine göre sıralayarak konu 5 için en iyi sözcüklere bakıp konu 5'i incele. - Sonuçları azalan
gammadeğerlerine göre sıralayarak konu 5 ile en çok hizalanan cümleleri görüp konu 5'i incele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Extract the beta and gamma matrices
sentence_betas <- tidy(sentence_lda, ___ = "___")
sentence_gammas <- tidy(sentence_lda, ___ = "___")
# Explore Topic 5 Betas
___ %>%
___(topic == ___) %>%
arrange(-___)
# Explore Topic 5 Gammas
___ %>%
___(topic == ___) %>%
arrange(-___)