NMF auf Wikipedia-Artikeln angewendet
Im Video hast du gesehen, wie NMF auf ein kleines Worthäufigkeit-Array angewendet wurde. Jetzt bist du dran: Wende NMF auf das tf-idf-Wortfrequenz-Array von Wikipedia-Artikeln an, das dir als CSR-Matrix namens articles vorliegt. Fitte das Modell und transformiere die Artikel. In der nächsten Übung schaust du dir das Ergebnis genauer an.
Diese Übung ist Teil des Kurses
Unsupervised Learning in Python
Anleitung zur Übung
- Importiere
NMFaussklearn.decomposition. - Erstelle eine
NMF-Instanz namensmodelmit6Komponenten. - Fitte das Modell auf die Worthäufigkeitsdaten namens
articles. - Verwende die Methode
.transform()vonmodel, umarticleszu transformieren, und weise das Ergebnisnmf_featureszu. - Gib
nmf_featuresaus, um einen ersten Eindruck zu bekommen (mit.round(2)werden die Einträge auf zwei Dezimalstellen gerundet).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import NMF
____
# Create an NMF instance: model
model = ____
# Fit the model to articles
____
# Transform the articles: nmf_features
nmf_features = ____
# Print the NMF features
print(nmf_features.round(2))