NMF-Features der Wikipedia-Artikel
Jetzt checkst du die NMF-Funktionen, die du in der letzten Übung erstellt hast. Eine Lösung für die vorherige Übung ist schon da, also kannst du das Array „ nmf_features “ einfach so nehmen. Es gibt auch eine Liste titles mit den Titeln aller Wikipedia-Artikel.
Wenn du dir die Features anschaust, fällt dir auf, dass bei beiden Schauspielern das NMF-Feature 3 den mit Abstand höchsten Wert hat. Das heißt, dass beide Artikel hauptsächlich mit der dritten NMF-Komponente rekonstruiert werden. Im nächsten Video erfährst du, warum: NMF-Komponenten stehen für Themen (zum Beispiel Schauspielerei!).
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
pandasalspd. - Erstell einen DataFrame „
df” aus „nmf_features” mit „pd.DataFrame()”. Setz den Index auf „titles” mit „index=titles”. - Nimm den Zugriff
.loc[]vondf, um die Zeile mit dem Titel'Anne Hathaway'auszuwählen, und zeig das Ergebnis an. Das sind die NMF-Features für den Artikel über die Schauspielerin Anne Hathaway. - Mach den letzten Schritt für „
'Denzel Washington'“ (ein anderer Schauspieler) noch mal.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)