1. Learn
  2. /
  3. Курси
  4. /
  5. Передобробка для машинного навчання в Python

Connected

вправа

Класифікація тексту з використанням векторів tf/idf

Тепер, коли ви закодували стовпець title у наборі даних volunteer у вектори tf/idf, використайте ці вектори, щоб передбачити стовпець category_desc.

Інструкції

100 XP
  • Розбийте вектор text_tfidf і цільову змінну y на тренувальну та тестову вибірки, встановивши параметр stratify рівним y, оскільки розподіл класів нерівномірний. Зверніть увагу, що потрібно викликати метод .toarray() для вектора tf/idf, щоб отримати належний формат для scikit-learn.
  • Підженеріть (натренуйте) модель Наївного Байєса nb на даних X_train та y_train.
  • Виведіть точність на тестовій вибірці.