Tf-idf-Werte untersuchen
Nachdem du Tf-idf-Features erstellt hast, willst du oft verstehen, welche Wörter in jedem Korpus die höchsten Scores haben. Das erreichst du, indem du die Zeile isolierst, die du untersuchen möchtest, und dann die Scores von hoch nach niedrig sortierst.
Der DataFrame aus der letzten Übung (tv_df) steht dir in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
Feature Engineering für Machine Learning in Python
Anleitung zur Übung
- Weisen die erste Zeile von
tv_dfsample_rowzu. sample_rowist jetzt eine Serie von Gewichten, die Wörtern zugeordnet sind. Sortiere diese Werte, um die 5 höchstbewerteten Wörter auszugeben.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Isolate the row to be examined
sample_row = tv_df.____
# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())