NMF appliquée aux articles Wikipédia
Dans la vidéo, vous avez observé l'application de la NMF pour transformer un tableau de fréquence des mots de jouets. À présent, il vous revient d'appliquer la NMF, en utilisant cette fois-ci le tableau de fréquence des mots tf-idf des articles Wikipédia, fourni sous forme de matrice csr « articles ». Ici, ajustez le modèle et transformez les articles. Dans l'exercice suivant, vous explorerez le résultat.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Importez « NMF » depuis « sklearn.decomposition ».
- Créez une instance « NMF » appelée « model » avec « 6 » composants.
- Adaptez le modèle aux données de comptage de mots « articles ».
- Utilisez la méthode « .transform() » de « model » pour transformer « articles » et attribuez le résultat à « nmf_features ».
- Imprimez
nmf_featurespour obtenir une première idée de son apparence (.round(2)arrondit les entrées à 2 décimales).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import NMF
____
# Create an NMF instance: model
model = ____
# Fit the model to articles
____
# Transform the articles: nmf_features
nmf_features = ____
# Print the NMF features
print(nmf_features.round(2))