ComeçarComece de graça

Modelo LDA

Agora é hora de construir o modelo LDA. Usando o dictionary e o corpus, você está pronto para descobrir quais tópicos estão presentes nos e-mails da Enron. Com uma impressão rápida das palavras atribuídas aos tópicos, você pode fazer uma primeira exploração para ver se existem tópicos óbvios que se destacam. Lembre-se de que o modelo de tópicos é pesado de calcular, então vai levar um tempo para rodar. Vamos testar!

Este exercício faz parte do curso

Detecção de Fraudes em Python

Ver curso

Instruções do exercício

  • Construa o modelo LDA a partir dos modelos do gensim, inserindo o corpus e o dictionary.
  • Salve os 5 tópicos executando print topics nos resultados do modelo e selecione as 5 principais palavras.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Define the LDA model
ldamodel = gensim.models.____.____(____, num_topics=5, id2word=____, passes=5)

# Save the topics and top 5 words
topics = ____.____(num_words=____)

# Print the results
for topic in topics:
    print(topic)
Editar e executar o código