LDA alıştırması
En sevdiğin yeni kitap olan Animal Farm'da (Hayvan Çiftliği) Napoleon karakteri etrafındaki ortak temalarla ilgileniyorsun. Napoleon, yoldaşlarını insan liderlerini devirmeye ikna eden bir domuz. Sonunda Hayvan Çiftliği'nin yeni lideri de oluyor.
Napoleon'un adının geçtiği tüm cümleleri pig_sentences olarak çıkardın ve bu cümlelerin durak sözcükleri kaldırılmış, gövdeleme (stemming) yapılmış, belirteçlere ayrılmış sürümünü pig_tokens olarak oluşturdun. Bu cümleler üzerinde LDA uygula ve bazı konularla ilişkili en üst düzey sözcüklere göz at.
Bu egzersiz
R ile Doğal Dil İşlemeye Giriş
kursunun bir parçasıdırEgzersiz talimatları
pig_matrixüzerinde 10 konuyu belirleyerek LDA uygula. Tekrarlanabilirlik için rastgele tohumu1111olarak ayarla.- Sonuçlardan beta matrisini çıkar.
- Beta matrisini yalnızca konu 2 için filtrele ve değerleri beta azalan olacak şekilde sırala.
- Beta matrisini yalnızca konu 3 için filtrele ve değerleri beta azalan olacak şekilde sırala.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
library(topicmodels)
# Perform Topic Modeling
sentence_lda <-
___(___, k = ___, method = 'Gibbs', control = list(seed = ___))
# Extract the beta matrix
sentence_betas <- ___(sentence_lda, matrix = "___")
# Topic #2
sentence_betas %>%
___(topic == ___) %>%
arrange(-___)
# Topic #3
sentence_betas %>%
___(topic == ___) %>%
arrange(-___)