1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Preprocessing pro Machine Learning v Pythonu

Connected

Cvičení

Modelování datasetu UFO, část 2

Teď sestavíš model pomocí textového vektoru desc_tfidf a seznamu filtered_words, ze kterého vytvoříš filtrovaný textový vektor. Uvidíme, jestli se ti podaří na základě textu předpovědět type pozorování. Použiješ k tomu model Naive Bayes.

Pokyny

100 XP
  • Filtruj vektor desc_tfidf tak, že jako index předáš seznam filtered_words.
  • Rozděl příznaky filtered_text a y a zajisti rovnoměrné rozložení tříd v trénovací i testovací sadě; použij random_state s hodnotou 42.
  • Pomocí metody .fit() modelu nb natrénuj model na datech X_train a y_train.
  • Vypiš výsledek metody .score() modelu nb na sadách X_test a y_test.