NMF auf Wikipedia-Artikeln angewendet
Im Video hast du gesehen, wie NMF auf ein kleines Worthäufigkeit-Array angewendet wurde. Jetzt bist du dran: Wende NMF auf das tf-idf-Wortfrequenz-Array von Wikipedia-Artikeln an, das dir als CSR-Matrix namens articles vorliegt. Fitte das Modell und transformiere die Artikel. In der nächsten Übung schaust du dir das Ergebnis genauer an.
Diese Übung ist Teil des Kurses
<Kurs>Unsupervised Learning in Python</Kurs>Übungsanweisungen
- Importiere
NMFaussklearn.decomposition. - Erstelle eine
NMF-Instanz namensmodelmit6Komponenten. - Fitte das Modell auf die Worthäufigkeitsdaten namens
articles. - Verwende die Methode
.transform()vonmodel, umarticleszu transformieren, und weise das Ergebnisnmf_featureszu. - Gib
nmf_featuresaus, um einen ersten Eindruck zu bekommen (mit.round(2)werden die Einträge auf zwei Dezimalstellen gerundet).
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import NMF
____
# Create an NMF instance: model
model = ____
# Fit the model to articles
____
# Transform the articles: nmf_features
nmf_features = ____
# Print the NMF features
print(nmf_features.round(2))