1. Learn
  2. /
  3. Kurser
  4. /
  5. Uczenie nienadzorowane w Pythonie

Connected

övning

Cechy NMF artykułów z Wikipedii

Teraz zbadasz cechy NMF, które utworzyłeś w poprzednim ćwiczeniu. Rozwiązanie poprzedniego ćwiczenia zostało już wczytane, więc tablica nmf_features jest dostępna. Dostępna jest również lista titles zawierająca tytuły poszczególnych artykułów z Wikipedii.

Analizując cechy, zwróć uwagę, że dla obojga aktorów cecha NMF numer 3 ma zdecydowanie najwyższą wartość. Oznacza to, że oba artykuły są rekonstruowane głównie przy użyciu 3. składowej NMF. W następnym filmie zobaczysz dlaczego: składowe NMF reprezentują tematy (na przykład aktorstwo!).

Instruktioner

100 XP
  • Zaimportuj pandas jako pd.
  • Utwórz DataFrame df na podstawie nmf_features, używając pd.DataFrame(). Ustaw indeks na titles, przekazując index=titles.
  • Użyj akcesora .loc[] na df, aby wybrać wiersz o tytule 'Anne Hathaway', i wyświetl wynik. To są cechy NMF artykułu o aktorce Anne Hathaway.
  • Powtórz ostatni krok dla 'Denzel Washington' (kolejnego aktora).