Tf-idf avec Wikipédia
À vous de jouer pour déterminer de nouveaux termes significatifs pour votre corpus en appliquant le tf-idf de gensim. Vous disposez à nouveau des mêmes objets de corpus et de dictionnaire créés dans les exercices précédents : dictionary, corpus et doc. Le tf-idf donnera-t-il des résultats plus intéressants au niveau du document ?
TfidfModel a été importé pour vous depuis gensim.models.tfidfmodel.
Cet exercice fait partie du cours
<cours>Introduction au Natural Language Processing (NLP) en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Create a new TfidfModel using the corpus: tfidf
tfidf = ____
# Calculate the tfidf weights of doc: tfidf_weights
tfidf_weights = ____
# Print the first five weights
print(____)