CommencerCommencer gratuitement

Caractéristiques NMF des articles Wikipédia

Vous allez maintenant explorer les fonctionnalités NMF que vous avez créées dans l'exercice précédent. Une solution à l'exercice précédent a été préchargée, de sorte que le tableau nmf_features est disponible. Une liste est également disponible à l'adresse titles, qui répertorie le titre de chaque article Wikipédia.

Lorsque vous examinez les caractéristiques, veuillez noter que pour les deux acteurs, la caractéristique NMF 3 présente de loin la valeur la plus élevée. Cela signifie que les deux articles sont reconstruits en utilisant principalement la troisième composante NMF. Dans la vidéo suivante, vous comprendrez pourquoi : Les composants NMF représentent des sujets (par exemple, le théâtre).

Cet exercice fait partie du cours

Apprentissage non supervisé en Python

Afficher le cours

Instructions

  • Importez pandas en tant que pd.
  • Créez un DataFrame « df » à partir de « nmf_features » en utilisant « pd.DataFrame() ». Veuillez définir l'index sur « titles » à l'aide de la commande « index=titles ».
  • Veuillez utiliser l'accesseur .loc[] de df pour sélectionner la ligne dont le titre est 'Anne Hathaway', puis afficher le résultat. Voici les caractéristiques NMF de l'article sur l'actrice Anne Hathaway.
  • Répétez la dernière étape pour 'Denzel Washington' (un autre acteur).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import pandas
____

# Create a pandas DataFrame: df
df = ____

# Print the row for 'Anne Hathaway'
print(____)

# Print the row for 'Denzel Washington'
print(____)
Modifier et exécuter le code