Entraîner et tester le modèle de « fake news » avec CountVectorizer
À vous de jouer : entraînez le modèle de « fake news » à partir des caractéristiques que vous avez identifiées et extraites. Dans cet exercice, vous allez entraîner et tester un modèle Naive Bayes en utilisant les données de CountVectorizer.
Les ensembles d’entraînement et de test ont été créés, et count_vectorizer, count_train et count_test ont été calculés.
Cet exercice fait partie du cours
Introduction au Natural Language Processing (NLP) en Python
Instructions
- Importez le module
metricsdepuissklearnetMultinomialNBdepuissklearn.naive_bayes. - Instanciez un classifieur
MultinomialNBappelénb_classifier. - Ajustez le classifieur sur les données d’entraînement.
- Calculez les étiquettes prédites pour les données de test.
- Calculez et affichez le score de précision du classifieur.
- Calculez la matrice de confusion. Pour en faciliter la lecture, spécifiez l’argument nommé
labels=['FAKE', 'REAL'].
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)