LoslegenKostenlos loslegen

Tf-idf-Werte untersuchen

Nachdem du Tf-idf-Features erstellt hast, willst du oft verstehen, welche Wörter in jedem Korpus die höchsten Scores haben. Das erreichst du, indem du die Zeile isolierst, die du untersuchen möchtest, und dann die Scores von hoch nach niedrig sortierst.

Der DataFrame aus der letzten Übung (tv_df) steht dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

Feature Engineering für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Weisen die erste Zeile von tv_df sample_row zu.
  • sample_row ist jetzt eine Serie von Gewichten, die Wörtern zugeordnet sind. Sortiere diese Werte, um die 5 höchstbewerteten Wörter auszugeben.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Isolate the row to be examined
sample_row = tv_df.____

# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())
Code bearbeiten und ausführen