BaşlayınÜcretsiz başlayın

LDA alıştırması

En sevdiğin yeni kitap olan Animal Farm'da (Hayvan Çiftliği) Napoleon karakteri etrafındaki ortak temalarla ilgileniyorsun. Napoleon, yoldaşlarını insan liderlerini devirmeye ikna eden bir domuz. Sonunda Hayvan Çiftliği'nin yeni lideri de oluyor.

Napoleon'un adının geçtiği tüm cümleleri pig_sentences olarak çıkardın ve bu cümlelerin durak sözcükleri kaldırılmış, gövdeleme (stemming) yapılmış, belirteçlere ayrılmış sürümünü pig_tokens olarak oluşturdun. Bu cümleler üzerinde LDA uygula ve bazı konularla ilişkili en üst düzey sözcüklere göz at.

Bu egzersiz, kursun bir parçasıdır

R ile Doğal Dil İşlemeye Giriş

Kursa Göz Atın

Egzersiz talimatları

  • pig_matrix üzerinde 10 konuyu belirleyerek LDA uygula. Tekrarlanabilirlik için rastgele tohumu 1111 olarak ayarla.
  • Sonuçlardan beta matrisini çıkar.
  • Beta matrisini yalnızca konu 2 için filtrele ve değerleri beta azalan olacak şekilde sırala.
  • Beta matrisini yalnızca konu 3 için filtrele ve değerleri beta azalan olacak şekilde sırala.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

library(topicmodels)
# Perform Topic Modeling
sentence_lda <-
  ___(___, k = ___, method = 'Gibbs', control = list(seed = ___))
# Extract the beta matrix 
sentence_betas <- ___(sentence_lda, matrix = "___")

# Topic #2
sentence_betas %>%
  ___(topic == ___) %>%
  arrange(-___)
# Topic #3
sentence_betas %>%
  ___(topic == ___) %>%
  arrange(-___)
Kodu Düzenle ve Çalıştır