Caractéristiques NMF des articles Wikipédia
Vous allez maintenant explorer les fonctionnalités NMF que vous avez créées dans l'exercice précédent. Une solution à l'exercice précédent a été préchargée, de sorte que le tableau nmf_features
est disponible. Une liste est également disponible à l'adresse titles
, qui répertorie le titre de chaque article Wikipédia.
Lorsque vous examinez les caractéristiques, veuillez noter que pour les deux acteurs, la caractéristique NMF 3 présente de loin la valeur la plus élevée. Cela signifie que les deux articles sont reconstruits en utilisant principalement la troisième composante NMF. Dans la vidéo suivante, vous comprendrez pourquoi : Les composants NMF représentent des sujets (par exemple, le théâtre).
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Importez
pandas
en tant quepd
. - Créez un DataFrame «
df
» à partir de «nmf_features
» en utilisant «pd.DataFrame()
». Veuillez définir l'index sur «titles
» à l'aide de la commande «index=titles
». - Veuillez utiliser l'accesseur
.loc[]
dedf
pour sélectionner la ligne dont le titre est'Anne Hathaway'
, puis afficher le résultat. Voici les caractéristiques NMF de l'article sur l'actrice Anne Hathaway. - Répétez la dernière étape pour
'Denzel Washington'
(un autre acteur).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)