Entraînement et test du modèle "fake news" avec CountVectorizer
C'est maintenant à vous d'entraîner le modèle "fake news" à l'aide des caractéristiques que vous avez identifiées et extraites. Dans ce premier exercice, vous entraînerez et testerez un modèle Naive Bayes en utilisant les données CountVectorizer
.
Les ensembles de formation et de test ont été créés, et count_vectorizer
, count_train
, et count_test
ont été calculés.
Cet exercice fait partie du cours
Introduction au traitement du langage naturel en Python
Instructions
- Importez le module
metrics
à partir desklearn
etMultinomialNB
à partir desklearn.naive_bayes
. - Instanciez un classificateur
MultinomialNB
appelénb_classifier
. - Ajustez le classificateur aux données d'apprentissage.
- Calculez les étiquettes prédites pour les données de test.
- Calculez et imprimez le score de précision du classificateur.
- Calculez la matrice de confusion. Pour faciliter la lecture, spécifiez l'argument du mot-clé
labels=['FAKE', 'REAL']
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)