1. Learn
  2. /
  3. Курси
  4. /
  5. Наглядове навчання в Python

Connected

вправа

Які статті подібні до 'Cristiano Ronaldo'?

У відео ви дізналися, як використовувати ознаки NMF і косинусну подібність, щоб знаходити подібні статті. Застосуйте це до вашої моделі NMF для популярних статей Вікіпедії: знайдіть статті, найбільш подібні до статті про футболіста Кріштіану Роналду. Отримані раніше ознаки NMF доступні як nmf_features, а titles — це список назв статей.

Інструкції

100 XP
  • Імпортуйте normalize з sklearn.preprocessing.
  • Застосуйте функцію normalize() до nmf_features. Збережіть результат у norm_features.
  • Створіть датафрейм df з norm_features, використавши titles як індекс.
  • Скористайтеся доступом .loc[] датафрейму df, щоб вибрати рядок 'Cristiano Ronaldo'. Присвойте результат змінній article.
  • Застосуйте метод .dot() датафрейму df до article, щоб обчислити косинусну подібність кожного рядка з article.
  • Виведіть результат методу .nlargest() для similarities, щоб показати найподібніші статті. Це вже зроблено для вас, тож натисніть "Submit Answer", щоб побачити результат!