1. Learn
  2. /
  3. Курси
  4. /
  5. Unsupervised Learning in Python

Connected

вправа

Regrouper des articles Wikipédia – partie II

Il est maintenant temps de mettre au travail votre pipeline de l'exercice précédent ! On vous fournit un tableau articles contenant les fréquences de mots tf-idf de certains articles Wikipédia populaires, ainsi qu'une liste titles de leurs titres. Utilisez votre pipeline pour regrouper les articles Wikipédia.

Une solution à l'exercice précédent a été préchargée pour vous ; un objet Pipeline pipeline enchaînant TruncatedSVD et KMeans est donc disponible.

Інструкції

100 XP
  • Importez pandas sous le nom pd.
  • Ajustez le pipeline au tableau de fréquences de mots articles.
  • Prédisez les étiquettes de regroupement.
  • Alignez les étiquettes de regroupement avec la liste titles des titres d'articles en créant un DataFrame df avec labels et titles comme colonnes. Cela a été fait pour vous.
  • Utilisez la méthode .sort_values() de df pour trier le DataFrame selon la colonne 'label', puis affichez le résultat.
  • Appuyez sur Soumettre et prenez un moment pour examiner votre superbe regroupement de pages Wikipédia !