Een LDA fitten
Tijd om je eerste topicmodel te draaien! Zoals besproken zijn de drie extra argumenten van de functie LDA() cruciaal om een topicmodel goed uit te voeren. Let op: het uitvoeren van LDA() kan ongeveer 10 seconden duren. De pakketten tidyverse en tidytext en de gegevensset tidy_twitter zijn alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Introductie tot tekstanalyse in R
Oefeninstructies
- Laad het pakket
topicmodels. - Zet de woordfrequenties per tweet om naar een DTM.
- Voer een LDA uit met 2 topics en een Gibbs-sampler.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the topicmodels package
___
# Cast the word counts by tweet into a DTM
dtm_twitter <- ___ %>%
___(___) %>%
___(___)
# Run an LDA with 2 topics and a Gibbs sampler
lda_out <- LDA(
___,
k = ___,
method = ___,
control = list(seed = 42)
)