NMF appliqué aux articles Wikipédia
Dans la vidéo, vous avez observé l'application de la NMF pour transformer un tableau de fréquence de mots fictifs. À présent, c'est à vous d'appliquer la NMF, en utilisant cette fois-ci le tableau de fréquence des mots tf-idf des articles Wikipédia, fourni sous forme de matrice csr articles
. Ici, ajustez le modèle et transformez les articles. Dans l'exercice suivant, vous explorerez le résultat.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Importez
NMF
à partir desklearn.decomposition
. - Créez une instance d'
NMF
appeléemodel
avec les composants6
. - Ajustez le modèle aux données relatives au nombre de mots
articles
. - Veuillez utiliser la méthode
.transform()
demodel
pour transformerarticles
et attribuer le résultat ànmf_features
. - Veuillez imprimer l'
nmf_features
pour avoir une première idée de son apparence (.round(2)
arrondit les entrées à 2 décimales).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import NMF
____
# Create an NMF instance: model
model = ____
# Fit the model to articles
____
# Transform the articles: nmf_features
nmf_features = ____
# Print the NMF features
print(nmf_features.round(2))