Tf-idf mit Wikipedia
Jetzt bist du an der Reihe, neue signifikante Begriffe für deinen Korpus zu bestimmen, indem du gensim
's tf-idf anwendest. Du hast wieder Zugriff auf die gleichen Korpus- und Wörterbuchobjekte, die du in den vorherigen Übungen erstellt hast - dictionary
, corpus
und doc
. Führt tf-idf zu interessanteren Ergebnissen auf Dokumentenebene?
TfidfModel
wurde für dich von gensim.models.tfidfmodel
importiert.
Diese Übung ist Teil des Kurses
Einführung in die natürliche Sprachverarbeitung in Python
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create a new TfidfModel using the corpus: tfidf
tfidf = ____
# Calculate the tfidf weights of doc: tfidf_weights
tfidf_weights = ____
# Print the first five weights
print(____)