CommencerCommencer gratuitement

Entraîner Naive Bayes avec sélection de caractéristiques

Vous allez maintenant relancer le modèle de classification de texte Naive Bayes utilisé à la fin du chapitre 3, en utilisant nos choix de sélection de l’exercice précédent : les colonnes title et category_desc du jeu de données volunteer.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Utilisez train_test_split() sur le vecteur de texte filtered_text, les étiquettes y (qui correspondent aux étiquettes category_desc), et passez l’ensemble y au paramètre stratify, car la distribution des classes est déséquilibrée.
  • Ajustez le modèle Naive Bayes nb sur X_train et y_train.
  • Calculez la précision sur le jeu de test de nb.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)

# Fit the model to the training data
nb.____

# Print out the model's accuracy
print(nb.____)
Modifier et exécuter le code