NMF auf Wikipedia-Artikel angewendet
Im Video hast du gesehen, wie NMF angewendet wurde, um eine Spielzeug-Wortfrequenzmatrix umzuwandeln. Jetzt bist du dran, NMF anzuwenden, diesmal mit dem tf-idf-Wortfrequenz-Array von Wikipedia-Artikeln, das als csr-Matrix articles
angegeben ist. Hier passt du das Modell an und verwandelst die Artikel. In der nächsten Übung wirst du das Ergebnis anschauen.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
- Importiere
NMF
aussklearn.decomposition
. - Erstell eine Instanz namens „
NMF
” mit dem Namen „model
” und den folgenden Komponenten: „6
”. - Passe das Modell an die Wortzählungsdaten an
articles
. - Verwende die Methode „
.transform()
“ von „model
“, um „articles
“ umzuwandeln, und weise das Ergebnis „nmf_features
“ zu. - Druck „
nmf_features
“, um zu sehen, wie das aussieht (.round(2)
rundet die Einträge auf 2 Dezimalstellen).
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import NMF
____
# Create an NMF instance: model
model = ____
# Fit the model to articles
____
# Transform the articles: nmf_features
nmf_features = ____
# Print the NMF features
print(nmf_features.round(2))