Modello LDA
È il momento di costruire il modello LDA. Usando dictionary e corpus, sei pronto a scoprire quali topic sono presenti nelle email di Enron. Con una veloce stampa delle parole assegnate ai topic puoi fare una prima esplorazione e vedere se emergono argomenti evidenti. Tieni presente che il topic model è pesante da calcolare, quindi l’esecuzione richiederà un po’ di tempo. Proviamoci!
Questo esercizio fa parte del corso
Rilevamento delle frodi in Python
Istruzioni dell'esercizio
- Crea il modello LDA dai modelli di gensim, inserendo
corpusedictionary. - Salva i 5 topic eseguendo
printsui topic nei risultati del modello e seleziona le prime 5 parole.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Define the LDA model
ldamodel = gensim.models.____.____(____, num_topics=5, id2word=____, passes=5)
# Save the topics and top 5 words
topics = ____.____(num_words=____)
# Print the results
for topic in topics:
print(topic)