Caractéristiques NMF des articles Wikipédia
Vous allez maintenant explorer les caractéristiques NMF que vous avez créées dans l'exercice précédent. Une solution à l'exercice précédent a été préchargée, de sorte que le tableau nmf_features est disponible. Une liste titles donnant le titre de chaque article Wikipédia est également disponible.
Lorsque vous examinez les fonctionnalités, notez que pour les deux acteurs, la fonctionnalité NMF 3 a de loin la valeur la plus élevée. Cela signifie que les deux articles sont reconstruits en utilisant principalement le troisième composant NMF. Dans la vidéo suivante, vous comprendrez pourquoi : les composants NMF représentent des thèmes (par exemple, le métier d'acteur).
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Importez
pandasen tant quepd. - Créez un DataFrame
dfà partir denmf_featuresen utilisantpd.DataFrame(). Définissez l'index surtitlesen utilisantindex=titles. - Utilisez l'accesseur
.loc[]dedfpour sélectionner la ligne avec le titre« Anne Hathaway », puis affichez le résultat. Il s'agit des caractéristiques NMF pour l'article sur l'actrice Anne Hathaway. - Répétez la dernière étape pour
« Denzel Washington »(un autre acteur).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)