CommencerCommencer gratuitement

Caractéristiques NMF des articles Wikipédia

Vous allez maintenant explorer les caractéristiques NMF que vous avez créées dans l'exercice précédent. Une solution à l'exercice précédent a été préchargée, de sorte que le tableau nmf_features est disponible. Une liste titles donnant le titre de chaque article Wikipédia est également disponible.

Lorsque vous examinez les fonctionnalités, notez que pour les deux acteurs, la fonctionnalité NMF 3 a de loin la valeur la plus élevée. Cela signifie que les deux articles sont reconstruits en utilisant principalement le troisième composant NMF. Dans la vidéo suivante, vous comprendrez pourquoi : les composants NMF représentent des thèmes (par exemple, le métier d'acteur).

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Importez pandas en tant que pd.
  • Créez un DataFrame df à partir de nmf_features en utilisant pd.DataFrame(). Définissez l'index sur titles en utilisant index=titles.
  • Utilisez l'accesseur .loc[] de df pour sélectionner la ligne avec le titre « Anne Hathaway », puis affichez le résultat. Il s'agit des caractéristiques NMF pour l'article sur l'actrice Anne Hathaway.
  • Répétez la dernière étape pour « Denzel Washington » (un autre acteur).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import pandas
____

# Create a pandas DataFrame: df
df = ____

# Print the row for 'Anne Hathaway'
print(____)

# Print the row for 'Denzel Washington'
print(____)
Modifier et exécuter le code