1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Unsupervised Learning in Python

Connected

cvičení

NMF příznaky článků z Wikipedie

Teď prozkoumáš NMF příznaky, které jsi vytvořil/a v předchozím cvičení. Řešení předchozího cvičení bylo předem načteno, takže pole nmf_features je dostupné. K dispozici je také seznam titles s názvy jednotlivých článků na Wikipedii.

Až budeš příznaky zkoumat, všimni si, že u obou herců má NMF příznak č. 3 zdaleka nejvyšší hodnotu. To znamená, že oba články jsou rekonstruovány převážně pomocí 3. NMF komponenty. V následujícím videu uvidíš proč: NMF komponenty reprezentují témata (například herectví!).

Pokyny

100 XP
  • Importuj pandas jako pd.
  • Vytvoř DataFrame df z pole nmf_features pomocí pd.DataFrame(). Nastav index na titles pomocí index=titles.
  • Pomocí přístupového objektu .loc[] na df vyber řádek s názvem 'Anne Hathaway' a výsledek vypiš. To jsou NMF příznaky článku o herečce Anne Hathaway.
  • Zopakuj poslední krok pro 'Denzel Washington' (dalšího herce).