Erste SchritteKostenlos loslegen

NMF Merkmale der Wikipedia-Artikel

Jetzt erkundest du die NMF Funktionen, die du in der vorherigen Übung erstellt hast. Eine Lösung für die vorherige Übung wurde vorgeladen, so dass das Feld nmf_features verfügbar ist. Außerdem gibt es eine Liste titles mit den Titeln der einzelnen Wikipedia-Artikel.

Bei der Untersuchung der Merkmale fällt auf, dass bei beiden Akteuren das NMF Merkmal 3 den mit Abstand höchsten Wert hat. Das bedeutet, dass beide Artikel hauptsächlich mit der 3. NMF Komponente rekonstruiert werden. Im nächsten Video erfährst du, warum: NMF Komponenten stehen für Themen (zum Beispiel Schauspiel!).

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere pandas als pd.
  • Erstelle einen DataFrame df aus nmf_features mit pd.DataFrame(). Setze den Index auf titles mit index=titles.
  • Verwende den .loc[] Accessor von df, um die Zeile mit dem Titel 'Anne Hathaway' auszuwählen, und drucke das Ergebnis aus. Dies sind die NMF Merkmale für den Artikel über die Schauspielerin Anne Hathaway.
  • Wiederhole den letzten Schritt für 'Denzel Washington' (einen anderen Akteur).

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Import pandas
____

# Create a pandas DataFrame: df
df = ____

# Print the row for 'Anne Hathaway'
print(____)

# Print the row for 'Denzel Washington'
print(____)
Bearbeiten und Ausführen von Code