LoslegenKostenlos loslegen

NMF-Merkmale der Wikipedia-Artikel

Jetzt erkundest du die NMF-Merkmale, die du in der vorherigen Übung erstellt hast. Eine Lösung der vorherigen Übung wurde vorab geladen, daher ist das Array nmf_features verfügbar. Ebenfalls verfügbar ist eine Liste namens titles, die den Titel jedes Wikipedia-Artikels enthält.

Achte beim Untersuchen der Merkmale darauf, dass bei beiden Schauspieler:innen das NMF-Merkmal 3 mit Abstand den höchsten Wert hat. Das bedeutet, dass beide Artikel hauptsächlich mit der dritten NMF-Komponente rekonstruiert werden. Im nächsten Video siehst du, warum: NMF-Komponenten repräsentieren Themen (zum Beispiel Schauspiel!).

Diese Übung ist Teil des Kurses

Unsupervised Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere pandas als pd.
  • Erstelle einen DataFrame df aus nmf_features mit pd.DataFrame(). Setze den Index mit index=titles auf titles.
  • Verwende .loc[] von df, um die Zeile mit dem Titel 'Anne Hathaway' auszuwählen, und gib das Ergebnis aus. Das sind die NMF-Merkmale für den Artikel über die Schauspielerin Anne Hathaway.
  • Wiederhole den letzten Schritt für 'Denzel Washington' (ebenfalls ein Schauspieler).

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import pandas
____

# Create a pandas DataFrame: df
df = ____

# Print the row for 'Anne Hathaway'
print(____)

# Print the row for 'Denzel Washington'
print(____)
Code bearbeiten und ausführen