Entraîner et tester le modèle de « fake news » avec CountVectorizer

À vous de jouer : entraînez le modèle de « fake news » à partir des caractéristiques que vous avez identifiées et extraites. Dans cet exercice, vous allez entraîner et tester un modèle Naive Bayes en utilisant les données de CountVectorizer.

Les ensembles d’entraînement et de test ont été créés, et count_vectorizer, count_train et count_test ont été calculés.

Cet exercice fait partie du cours

<cours>Introduction au Natural Language Processing (NLP) en Python</cours>

Voir le cours

Instructions de l’exercice

Importez le module metrics depuis sklearn et MultinomialNB depuis sklearn.naive_bayes.
Instanciez un classifieur MultinomialNB appelé nb_classifier.
Ajustez le classifieur sur les données d’entraînement.
Calculez les étiquettes prédites pour les données de test.
Calculez et affichez le score de précision du classifieur.
Calculez la matrice de confusion. Pour en faciliter la lecture, spécifiez l’argument nommé labels=['FAKE', 'REAL'].

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import the necessary modules
____
____

# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)

Modifier et exécuter le code