1. Nauka
  2. /
  3. Kursy
  4. /
  5. Preprocessing w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Klasyfikacja tekstu z użyciem wektorów tf/idf

Po przekształceniu kolumny title ze zbioru danych volunteer w wektory tf/idf, użyjesz tych wektorów do przewidywania wartości w kolumnie category_desc.

Instrukcje

100 XP
  • Podziel wektor text_tfidf i zmienną docelową y na zbiory treningowy i testowy, ustawiając parametr stratify równy y – rozkład klas jest nierównomierny. Zwróć uwagę, że na wektorze tf/idf trzeba wywołać metodę .toarray(), aby uzyskać format wymagany przez scikit-learn.
  • Dopasuj dane X_train i y_train do modelu Naive Bayes nb.
  • Wyświetl dokładność modelu na zbiorze testowym.