CommencerCommencer gratuitement

Entraînement et test du modèle "fake news" avec CountVectorizer

C'est maintenant à vous d'entraîner le modèle "fake news" à l'aide des caractéristiques que vous avez identifiées et extraites. Dans ce premier exercice, vous entraînerez et testerez un modèle Naive Bayes en utilisant les données CountVectorizer.

Les ensembles de formation et de test ont été créés, et count_vectorizer, count_train, et count_test ont été calculés.

Cet exercice fait partie du cours

Introduction au traitement du langage naturel en Python

Afficher le cours

Instructions

  • Importez le module metrics à partir de sklearn et MultinomialNB à partir de sklearn.naive_bayes.
  • Instanciez un classificateur MultinomialNB appelé nb_classifier.
  • Ajustez le classificateur aux données d'apprentissage.
  • Calculez les étiquettes prédites pour les données de test.
  • Calculez et imprimez le score de précision du classificateur.
  • Calculez la matrice de confusion. Pour faciliter la lecture, spécifiez l'argument du mot-clé labels=['FAKE', 'REAL'].

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the necessary modules
____
____

# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Modifier et exécuter le code