NMF Merkmale der Wikipedia-Artikel
Jetzt erkundest du die NMF Funktionen, die du in der vorherigen Übung erstellt hast. Eine Lösung für die vorherige Übung wurde vorgeladen, so dass das Feld nmf_features
verfügbar ist. Außerdem gibt es eine Liste titles
mit den Titeln der einzelnen Wikipedia-Artikel.
Bei der Untersuchung der Merkmale fällt auf, dass bei beiden Akteuren das NMF Merkmal 3 den mit Abstand höchsten Wert hat. Das bedeutet, dass beide Artikel hauptsächlich mit der 3. NMF Komponente rekonstruiert werden. Im nächsten Video erfährst du, warum: NMF Komponenten stehen für Themen (zum Beispiel Schauspiel!).
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
pandas
alspd
. - Erstelle einen DataFrame
df
ausnmf_features
mitpd.DataFrame()
. Setze den Index auftitles
mitindex=titles
. - Verwende den
.loc[]
Accessor vondf
, um die Zeile mit dem Titel'Anne Hathaway'
auszuwählen, und drucke das Ergebnis aus. Dies sind die NMF Merkmale für den Artikel über die Schauspielerin Anne Hathaway. - Wiederhole den letzten Schritt für
'Denzel Washington'
(einen anderen Akteur).
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)