LoslegenKostenlos loslegen

NMF-Features der Wikipedia-Artikel

Jetzt checkst du die NMF-Funktionen, die du in der letzten Übung erstellt hast. Eine Lösung für die vorherige Übung ist schon da, also kannst du das Array „ nmf_features “ einfach so nehmen. Es gibt auch eine Liste titles mit den Titeln aller Wikipedia-Artikel.

Wenn du dir die Features anschaust, fällt dir auf, dass bei beiden Schauspielern das NMF-Feature 3 den mit Abstand höchsten Wert hat. Das heißt, dass beide Artikel hauptsächlich mit der dritten NMF-Komponente rekonstruiert werden. Im nächsten Video erfährst du, warum: NMF-Komponenten stehen für Themen (zum Beispiel Schauspielerei!).

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere pandas als pd.
  • Erstell einen DataFrame „ df ” aus „ nmf_features ” mit „ pd.DataFrame() ”. Setz den Index auf „ titles ” mit „ index=titles ”.
  • Nimm den Zugriff .loc[] von df, um die Zeile mit dem Titel 'Anne Hathaway' auszuwählen, und zeig das Ergebnis an. Das sind die NMF-Features für den Artikel über die Schauspielerin Anne Hathaway.
  • Mach den letzten Schritt für „ 'Denzel Washington' “ (ein anderer Schauspieler) noch mal.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import pandas
____

# Create a pandas DataFrame: df
df = ____

# Print the row for 'Anne Hathaway'
print(____)

# Print the row for 'Denzel Washington'
print(____)
Code bearbeiten und ausführen