NMF toegepast op Wikipedia-artikelen
In de video zag je hoe NMF werd gebruikt om een eenvoudige woordfrequentie-array te transformeren. Nu ga jij aan de slag met NMF, dit keer met de tf-idf-woordfrequentie-array van Wikipedia-artikelen, gegeven als een csr-matrix articles. Pas hier het model toe en transformeer de artikelen. In de volgende oefening ga je het resultaat verkennen.
Deze oefening maakt deel uit van de cursus
Unsupervised Learning in Python
Oefeninstructies
- Importeer
NMFuitsklearn.decomposition. - Maak een
NMF-instantie met6componenten en noem dezemodel. - Fit het model op de woordtelfgegevens
articles. - Gebruik de methode
.transform()vanmodelomarticleste transformeren en ken het resultaat toe aannmf_features. - Print
nmf_featuresom een eerste indruk te krijgen van hoe het eruitziet (.round(2)rondt de waarden af op 2 decimalen.)
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import NMF
____
# Create an NMF instance: model
model = ____
# Fit the model to articles
____
# Transform the articles: nmf_features
nmf_features = ____
# Print the NMF features
print(nmf_features.round(2))