1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie nienadzorowane w Pythonie

Connected

ćwiczenie

Które artykuły są podobne do artykułu o Cristiano Ronaldo?

W tej lekcji pokazano, jak używać cech NMF i podobieństwa kosinusowego do znajdowania podobnych artykułów. Zastosuj tę metodę do swojego modelu NMF dla popularnych artykułów Wikipedii – znajdź artykuły najbardziej podobne do artykułu o piłkarzu Cristiano Ronaldo. Cechy NMF uzyskane wcześniej są dostępne jako nmf_features, a titles to lista tytułów artykułów.

Instrukcje

100 XP
  • Zaimportuj normalize z sklearn.preprocessing.
  • Zastosuj funkcję normalize() do nmf_features. Zapisz wynik jako norm_features.
  • Utwórz DataFrame df z norm_features, używając titles jako indeksu.
  • Za pomocą akcesora .loc[] obiektu df wybierz wiersz 'Cristiano Ronaldo'. Przypisz wynik do zmiennej article.
  • Zastosuj metodę .dot() obiektu df do article, aby obliczyć podobieństwo kosinusowe każdego wiersza względem article.
  • Wyświetl wynik metody .nlargest() obiektu similarities, aby zobaczyć najbardziej podobne artykuły. Ten krok jest już wykonany – kliknij Prześlij odpowiedź, aby zobaczyć wynik!