1. Învăţa
  2. /
  3. Courses
  4. /
  5. Preprocesare pentru Machine Learning în Python

Connected

exercise

Modelarea setului de date UFO, partea 2

În final, vei construi un model folosind vectorul de text creat anterior, desc_tfidf, și lista filtered_words pentru a crea un vector de text filtrat. Vom vedea dacă poți prezice tipul (type) observației pe baza textului. Vei folosi un model Naive Bayes pentru aceasta.

Instrucțiuni

100 XP
  • Filtrează vectorul desc_tfidf pasând o listă de filtered_words ca index.
  • Împarte caracteristicile filtered_text și y, asigurând o distribuție egală a claselor în seturile de antrenament și testare; folosește random_state cu valoarea 42.
  • Folosește metoda .fit() a modelului nb pentru a antrena modelul pe X_train și y_train.
  • Afișează scorul .score() al modelului nb pe seturile X_test și y_test.