NMF-Features der Wikipedia-Artikel
Jetzt checkst du die NMF-Funktionen, die du in der letzten Übung erstellt hast. Eine Lösung für die vorherige Übung ist schon da, also kannst du das Array „ nmf_features
“ einfach so nehmen. Es gibt auch eine Liste titles
mit den Titeln aller Wikipedia-Artikel.
Wenn du dir die Features anschaust, fällt dir auf, dass bei beiden Schauspielern das NMF-Feature 3 den mit Abstand höchsten Wert hat. Das heißt, dass beide Artikel hauptsächlich mit der dritten NMF-Komponente rekonstruiert werden. Im nächsten Video erfährst du, warum: NMF-Komponenten stehen für Themen (zum Beispiel Schauspielerei!).
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
pandas
alspd
. - Erstell einen DataFrame „
df
” aus „nmf_features
” mit „pd.DataFrame()
”. Setz den Index auf „titles
” mit „index=titles
”. - Nimm den Zugriff
.loc[]
vondf
, um die Zeile mit dem Titel'Anne Hathaway'
auszuwählen, und zeig das Ergebnis an. Das sind die NMF-Features für den Artikel über die Schauspielerin Anne Hathaway. - Mach den letzten Schritt für „
'Denzel Washington'
“ (ein anderer Schauspieler) noch mal.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)