1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do zpracování přirozeného jazyka v Pythonu

Connected

cvičení

Prozkoumání modelu

Teď, když máš klasifikátor falešných zpráv hotový, pojďme se podívat, co se model naučil. Důležité váhy vektoru můžeš namapovat zpět na skutečná slova pomocí jednoduchých inspekčních technik.

Máš k dispozici dobře fungující klasifikátor Naïve Bayes s TF-IDF jako nb_classifier a vektory jako tfidf_vectorizer.

Pokyny

100 XP
  • Ulož štítky tříd do proměnné class_labels přístupem k atributu .classes_ klasifikátoru nb_classifier.
  • Extrahuj příznaky pomocí metody .get_feature_names() objektu tfidf_vectorizer.
  • Vytvoř zazipované pole koeficientů klasifikátoru spolu s názvy příznaků a seřaď je podle koeficientů. K tomu nejdříve použij zip() s argumenty nb_classifier.coef_[0] a feature_names, a poté na výsledek aplikuj sorted().
  • Vypiš top 20 příznaků s nejvyšší váhou pro první štítek class_labels a 20 příznaků s nejnižší váhou pro druhý štítek class_labels. Tato část je již připravena za tebe.