Tf-idf avec Wikipédia
À vous de jouer pour déterminer de nouveaux termes significatifs pour votre corpus en appliquant le tf-idf de gensim. Vous disposez à nouveau des mêmes objets de corpus et de dictionnaire créés dans les exercices précédents : dictionary, corpus et doc. Le tf-idf donnera-t-il des résultats plus intéressants au niveau du document ?
TfidfModel a été importé pour vous depuis gensim.models.tfidfmodel.
Cet exercice fait partie du cours
Introduction au Natural Language Processing (NLP) en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a new TfidfModel using the corpus: tfidf
tfidf = ____
# Calculate the tfidf weights of doc: tfidf_weights
tfidf_weights = ____
# Print the first five weights
print(____)