Training und Test des "Fake News"-Modells mit TfidfVectorizer

Nachdem du das Modell mit CountVectorizer ausgewertet hast, machst du das Gleiche mit TfidfVectorizer und einem Naive Bayes-Modell.

Die Trainings- und Testgruppen wurden erstellt und tfidf_vectorizer, tfidf_train und tfidf_test berechnet. Außerdem wurden MultinomialNB und metrics von sklearn.naive_bayes bzw. sklearn importiert.

Diese Übung ist Teil des Kurses

Einführung in die natürliche Sprachverarbeitung in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen MultinomialNB Klassifikator namens nb_classifier.
  • Passe den Klassifikator an die Trainingsdaten an.
  • Berechne die vorhergesagten Tags für die Testdaten.
  • Berechne und drucke die Genauigkeit des Klassifikators.
  • Berechne die Konfusionsmatrix. Wie in der vorherigen Übung gibst du das Schlüsselwortargument labels=['FAKE', 'REAL'] an, damit die resultierende Konfusionsmatrix leichter zu lesen ist.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)