NMF-Merkmale der Wikipedia-Artikel
Jetzt erkundest du die NMF-Merkmale, die du in der vorherigen Übung erstellt hast. Eine Lösung der vorherigen Übung wurde vorab geladen, daher ist das Array nmf_features verfügbar. Ebenfalls verfügbar ist eine Liste namens titles, die den Titel jedes Wikipedia-Artikels enthält.
Achte beim Untersuchen der Merkmale darauf, dass bei beiden Schauspieler:innen das NMF-Merkmal 3 mit Abstand den höchsten Wert hat. Das bedeutet, dass beide Artikel hauptsächlich mit der dritten NMF-Komponente rekonstruiert werden. Im nächsten Video siehst du, warum: NMF-Komponenten repräsentieren Themen (zum Beispiel Schauspiel!).
Diese Übung ist Teil des Kurses
Unsupervised Learning in Python
Anleitung zur Übung
- Importiere
pandasalspd. - Erstelle einen DataFrame
dfausnmf_featuresmitpd.DataFrame(). Setze den Index mitindex=titlesauftitles. - Verwende
.loc[]vondf, um die Zeile mit dem Titel'Anne Hathaway'auszuwählen, und gib das Ergebnis aus. Das sind die NMF-Merkmale für den Artikel über die Schauspielerin Anne Hathaway. - Wiederhole den letzten Schritt für
'Denzel Washington'(ebenfalls ein Schauspieler).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)