1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie nienadzorowane w Pythonie

Connected

ćwiczenie

NMF odkrywa tematy dokumentów

W filmie dowiedziałeś się, że gdy NMF jest stosowany do dokumentów, składowe odpowiadają ich tematom, a cechy NMF pozwalają odtworzyć dokumenty z tych tematów. Sprawdź to samodzielnie na modelu NMF zbudowanym wcześniej na podstawie artykułów z Wikipedii. Poprzednio widziałeś, że 3. wartość cechy NMF była wysoka dla artykułów o aktorach Anne Hathaway i Denzelu Washingtonie. W tym ćwiczeniu określ temat odpowiadającej tej cesze składowej NMF.

Model NMF zbudowany wcześniej jest dostępny jako model, natomiast words to lista słów opisujących kolumny tablicy częstości słów.

Po ukończeniu ćwiczenia zastanów się, jaki temat łączy artykuły o Anne Hathaway i Denzelu Washingtonie!

Instrukcje

100 XP
  • Zaimportuj pandas jako pd.
  • Utwórz DataFrame components_df z model.components_, ustawiając columns=words, aby kolumny były opisane słowami.
  • Wyświetl components_df.shape, aby sprawdzić wymiary DataFrame.
  • Użyj akcesora .iloc[] na DataFrame components_df, aby wybrać wiersz 3. Przypisz wynik do zmiennej component.
  • Wywołaj metodę .nlargest() na component i wyświetl wynik. Zwróci ona pięć słów o najwyższych wartościach dla tej składowej.