NMF angewendet auf Wikipedia-Artikel
Im Video hast du gesehen, wie NMF ein Spielzeug-Wortfrequenzfeld transformiert hat. Jetzt bist du an der Reihe, NMF anzuwenden. Diesmal verwendest du die tf-idf-Worthäufigkeitsmatrix der Wikipedia-Artikel, die als csr-Matrix articles
vorliegt. Passe hier das Modell an und transformiere die Artikel. In der nächsten Übung wirst du das Ergebnis erkunden.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
NMF
vonsklearn.decomposition
. - Erstelle eine
NMF
Instanz namensmodel
mit6
Komponenten. - Passe das Modell an die Wortzahldaten an
articles
. - Verwende die Methode
.transform()
vonmodel
, umarticles
zu transformieren, und weise das Ergebnisnmf_features
zu. - Drucke
nmf_features
aus, um eine erste Vorstellung davon zu bekommen, wie es aussieht (.round(2)
rundet die Einträge auf 2 Dezimalstellen.)
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import NMF
____
# Create an NMF instance: model
model = ____
# Fit the model to articles
____
# Transform the articles: nmf_features
nmf_features = ____
# Print the NMF features
print(nmf_features.round(2))