Entraînement et test du modèle "fake news" avec TfidfVectorizer
Maintenant que vous avez évalué le modèle à l'aide de CountVectorizer
, vous allez faire de même en utilisant TfidfVectorizer
avec un modèle Naive Bayes.
Les ensembles de formation et de test ont été créés, et tfidf_vectorizer
, tfidf_train
, et tfidf_test
ont été calculés. En outre, MultinomialNB
et metrics
ont été importés respectivement de sklearn.naive_bayes
et sklearn
.
Cet exercice fait partie du cours
Introduction au traitement du langage naturel en Python
Instructions
- Instanciez un classificateur
MultinomialNB
appelénb_classifier
. - Ajustez le classificateur aux données d'apprentissage.
- Calculez les étiquettes prédites pour les données de test.
- Calculez et imprimez le score de précision du classificateur.
- Calculez la matrice de confusion. Comme dans l'exercice précédent, spécifiez l'argument mot-clé
labels=['FAKE', 'REAL']
afin que la matrice de confusion résultante soit plus facile à lire.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)