Modelo LDA
Agora é hora de construir o modelo LDA. Usando o dictionary e o corpus, você está pronto para descobrir quais tópicos estão presentes nos e-mails da Enron. Com uma impressão rápida das palavras atribuídas aos tópicos, você pode fazer uma primeira exploração para ver se existem tópicos óbvios que se destacam. Lembre-se de que o modelo de tópicos é pesado de calcular, então vai levar um tempo para rodar. Vamos testar!
Este exercício faz parte do curso
Detecção de Fraudes em Python
Instruções do exercício
- Construa o modelo LDA a partir dos modelos do gensim, inserindo o
corpuse odictionary. - Salve os 5 tópicos executando
printtopics nos resultados do modelo e selecione as 5 principais palavras.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define the LDA model
ldamodel = gensim.models.____.____(____, num_topics=5, id2word=____, passes=5)
# Save the topics and top 5 words
topics = ____.____(num_words=____)
# Print the results
for topic in topics:
print(topic)