CommencerCommencer gratuitement

Entraînement et test du modèle "fake news" avec TfidfVectorizer

Maintenant que vous avez évalué le modèle à l'aide de CountVectorizer, vous allez faire de même en utilisant TfidfVectorizer avec un modèle Naive Bayes.

Les ensembles de formation et de test ont été créés, et tfidf_vectorizer, tfidf_train, et tfidf_test ont été calculés. En outre, MultinomialNB et metrics ont été importés respectivement de sklearn.naive_bayes et sklearn.

Cet exercice fait partie du cours

Introduction au traitement du langage naturel en Python

Afficher le cours

Instructions

  • Instanciez un classificateur MultinomialNB appelé nb_classifier.
  • Ajustez le classificateur aux données d'apprentissage.
  • Calculez les étiquettes prédites pour les données de test.
  • Calculez et imprimez le score de précision du classificateur.
  • Calculez la matrice de confusion. Comme dans l'exercice précédent, spécifiez l'argument mot-clé labels=['FAKE', 'REAL'] afin que la matrice de confusion résultante soit plus facile à lire.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Modifier et exécuter le code