Konuları belgelere atama
LDA modelleri, sonuçlarını yorumlayıp kullanamadığın sürece pek işe yaramaz. Bir dizi cümle (pig_sentences) üzerinde çalıştırılan bir LDA modelinin (sentence_lda) sonuçları sana verildi. Herhangi bir LDA analizinin sonuçlarını tam olarak anlamak için hem konu başına en iyi sözcükleri veren beta matrisini hem de belge başına en iyi konuları veren gamma matrisini incelemen gerekiyor.
Bu iki matris hakkında bildiklerine dayanarak, belirli bir konu için sonuçları çıkar ve çıktının beklentilerle uyuşup uyuşmadığına bak.
Bu egzersiz, kursun bir parçasıdır
R ile Doğal Dil İşlemeye Giriş
Egzersiz talimatları
- Hem
betahem degammamatrisleri için birer tibble oluştur. - Sonuçları azalan
betadeğerlerine göre sıralayarak konu 5 için en iyi sözcüklere bakıp konu 5'i incele. - Sonuçları azalan
gammadeğerlerine göre sıralayarak konu 5 ile en çok hizalanan cümleleri görüp konu 5'i incele.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Extract the beta and gamma matrices
sentence_betas <- tidy(sentence_lda, ___ = "___")
sentence_gammas <- tidy(sentence_lda, ___ = "___")
# Explore Topic 5 Betas
___ %>%
___(topic == ___) %>%
arrange(-___)
# Explore Topic 5 Gammas
___ %>%
___(topic == ___) %>%
arrange(-___)