1. Learn
  2. /
  3. Курси
  4. /
  5. Prétraitement pour le Machine Learning en Python

Connected

вправа

Classification de texte avec des vecteurs tf/idf

Maintenant que vous avez encodé la colonne title du jeu de données volunteer en vecteurs tf/idf, vous allez utiliser ces vecteurs pour prédire la colonne category_desc.

Інструкції

100 XP
  • Séparez le vecteur text_tfidf et la variable cible y en ensembles d'entraînement et de test, en définissant le paramètre stratify égal à y, puisque la répartition des classes est inégale. Remarquez que nous devons exécuter la méthode .toarray() sur le vecteur tf/idf afin d'obtenir le bon format pour scikit-learn.
  • Ajustez les données X_train et y_train au modèle Naive Bayes, nb.
  • Affichez la justesse sur l'ensemble de test.