1. Learn
  2. /
  3. Kurser
  4. /
  5. Preprocesare pentru Machine Learning în Python

Connected

övning

Clasificarea textelor folosind vectori tf/idf

Acum că ai codificat coloana title din setul de date volunteer în vectori tf/idf, vei folosi acești vectori pentru a prezice coloana category_desc.

Instruktioner

100 XP
  • Împarte vectorul text_tfidf și variabila țintă y în seturi de antrenament și de testare, setând parametrul stratify egal cu y, deoarece distribuția claselor este neuniformă. Reține că trebuie să aplici metoda .toarray() pe vectorul tf/idf, pentru a-l aduce în formatul corect pentru scikit-learn.
  • Antrenează modelul Naive Bayes nb pe datele X_train și y_train.
  • Afișează acuratețea pe setul de testare.