Entraînement et test du modèle "fake news" avec CountVectorizer
C'est maintenant à vous d'entraîner le modèle "fake news" à l'aide des caractéristiques que vous avez identifiées et extraites. Dans ce premier exercice, vous entraînerez et testerez un modèle Naive Bayes en utilisant les données CountVectorizer.
Les ensembles de formation et de test ont été créés, et count_vectorizer, count_train, et count_test ont été calculés.
Cet exercice fait partie du cours
Introduction au traitement du langage naturel en Python
Instructions
- Importez le module
metricsà partir desklearnetMultinomialNBà partir desklearn.naive_bayes. - Instanciez un classificateur
MultinomialNBappelénb_classifier. - Ajustez le classificateur aux données d'apprentissage.
- Calculez les étiquettes prédites pour les données de test.
- Calculez et imprimez le score de précision du classificateur.
- Calculez la matrice de confusion. Pour faciliter la lecture, spécifiez l'argument du mot-clé
labels=['FAKE', 'REAL'].
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)