1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Preprocessing pro Machine Learning v Pythonu

Connected

cvičení

Textová klasifikace pomocí tf/idf vektorů

Teď, když máš sloupec title z datasetu volunteer zakódovaný do tf/idf vektorů, použiješ tyto vektory k predikci sloupce category_desc.

Pokyny

100 XP
  • Rozděl vektor text_tfidf a cílovou proměnnou y na trénovací a testovací sadu — nastav parametr stratify na y, protože rozložení tříd je nerovnoměrné. Nezapomeň, že na tf/idf vektor je potřeba zavolat metodu .toarray(), aby měl správný formát pro scikit-learn.
  • Natrénuj model Naive Bayes nb na datech X_train a y_train.
  • Vypiš přesnost modelu na testovací sadě.