1. Learn
  2. /
  3. Курси
  4. /
  5. Наглядове навчання в Python

Connected

вправа

NMF вивчає теми документів

У відео ви дізналися, що коли NMF застосовують до документів, компоненти відповідають темам документів, а ознаки NMF відновлюють документи з тем. Переконайтеся в цьому самостійно для моделі NMF, яку ви будували раніше, використовуючи статті з Wikipedia. Раніше ви бачили, що значення 3-ї ознаки NMF було високим для статей про акторів Енн Гетевей і Дензела Вашингтона. У цій вправі визначте тему відповідного компонента NMF.

Модель NMF, яку ви створили раніше, доступна як model, а words — це список слів, якими позначено стовпці масиву частот слів.

Коли закінчите, подумайте, яку спільну тему мають статті про Енн Гетевей і Дензела Вашингтона!

Інструкції

100 XP
  • Імпортуйте pandas як pd.
  • Створіть DataFrame components_df з model.components_, вказавши columns=words, щоб стовпці були підписані словами.
  • Виведіть components_df.shape, щоб перевірити розміри DataFrame.
  • Скористайтеся індексатором .iloc[] для DataFrame components_df, щоб вибрати рядок 3. Присвойте результат змінній component.
  • Викличте метод .nlargest() у component та виведіть результат. Це дасть п'ять слів із найбільшими значеннями для цього компонента.