LoslegenKostenlos loslegen

Training und Testen des „Fake News“-Modells mit TfidfVectorizer

Nachdem du das Modell mit dem CountVectorizer bewertet hast, machst du dasselbe nun mit dem TfidfVectorizer in Kombination mit einem Naive-Bayes-Modell.

Die Trainings- und Test-Sets wurden erstellt, und tfidf_vectorizer, tfidf_train sowie tfidf_test wurden berechnet. Außerdem wurden MultinomialNB und metrics aus sklearn.naive_bayes bzw. sklearn importiert.

Diese Übung ist Teil des Kurses

Einführung in Natural Language Processing mit Python

Kurs anzeigen

Anleitung zur Übung

  • Instanziiere einen MultinomialNB-Klassifikator mit dem Namen nb_classifier.
  • Fitte den Klassifikator auf die Trainingsdaten.
  • Berechne die vorhergesagten Tags für die Testdaten.
  • Berechne und gib die Genauigkeit des Klassifikators aus.
  • Berechne die Konfusionsmatrix. Gib wie in der vorherigen Übung das Schlüsselwortargument labels=['FAKE', 'REAL'] an, damit die resultierende Konfusionsmatrix leichter zu lesen ist.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Code bearbeiten und ausführen