Tf-idf avec Wikipedia
C'est maintenant à vous de déterminer les nouveaux termes significatifs pour votre corpus en appliquant gensim
's tf-idf. Vous aurez à nouveau accès aux mêmes objets corpus et dictionnaire que ceux que vous avez créés dans les exercices précédents - dictionary
, corpus
, et doc
. La méthode tf-idf permettra-t-elle d'obtenir des résultats plus intéressants au niveau des documents ?
TfidfModel
a été importé pour vous de gensim.models.tfidfmodel
.
Cet exercice fait partie du cours
Introduction au traitement du langage naturel en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a new TfidfModel using the corpus: tfidf
tfidf = ____
# Calculate the tfidf weights of doc: tfidf_weights
tfidf_weights = ____
# Print the first five weights
print(____)