1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w R

Connected

ćwiczenie

Testowanie perplexity

Otrzymujesz zbiór danych zawierający tweety wysłane przez boty tweetowe podczas wyborów prezydenckich w USA w 2016 roku. Twój przełożony zidentyfikował dwa typy kont, które go interesują: Left i Right. Poproszono cię o przeprowadzenie modelowania tematów na tweetach botów typu Right. Celem jest podsumowanie zawartości tych tweetów za pomocą modelowania tematów. Wykonaj modelowanie tematów dla 5, 15 i 50 tematów, aby określić przybliżoną liczbę tematów zawartych w danych.

Instrukcje 1/3

undefined XP
  • 1
    • Przeprowadź LDA metodą 'Gibbs' dla 5 tematów i wyświetl wynik perplexity zarówno dla zbioru train, jak i test.
  • 2
    • Przeprowadź modelowanie tematów dla 15 tematów.
  • 3
    • Przeprowadź modelowanie tematów dla 50 tematów.