LDA-model

Tijd om het LDA-model te bouwen. Met de dictionary en corpus ga je ontdekken welke topics in de Enron-e-mails voorkomen. Met een snelle print van de woorden die aan de topics zijn toegewezen, kun je alvast verkennen of er duidelijke onderwerpen uitspringen. Let op dat het topicmodel zwaar te berekenen is, dus het duurt even om te draaien. Laten we het proberen!

Deze oefening maakt deel uit van de cursus

Fraudedetectie in Python

Bekijk cursus

Oefeninstructies

Bouw het LDA-model uit de gensim-modellen door corpus en dictionary in te voegen.
Sla de 5 topics op door print topics op de modelresultaten uit te voeren en selecteer de top 5 woorden.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Define the LDA model
ldamodel = gensim.models.____.____(____, num_topics=5, id2word=____, passes=5)

# Save the topics and top 5 words
topics = ____.____(num_words=____)

# Print the results
for topic in topics:
    print(topic)

Code bewerken en uitvoeren