Training und Testen des „Fake News“-Modells mit TfidfVectorizer
Nachdem du das Modell mit dem CountVectorizer bewertet hast, machst du dasselbe nun mit dem TfidfVectorizer in Kombination mit einem Naive-Bayes-Modell.
Die Trainings- und Test-Sets wurden erstellt, und tfidf_vectorizer, tfidf_train sowie tfidf_test wurden berechnet. Außerdem wurden MultinomialNB und metrics aus sklearn.naive_bayes bzw. sklearn importiert.
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit Python
Anleitung zur Übung
- Instanziiere einen
MultinomialNB-Klassifikator mit dem Namennb_classifier. - Fitte den Klassifikator auf die Trainingsdaten.
- Berechne die vorhergesagten Tags für die Testdaten.
- Berechne und gib die Genauigkeit des Klassifikators aus.
- Berechne die Konfusionsmatrix. Gib wie in der vorherigen Übung das Schlüsselwortargument
labels=['FAKE', 'REAL']an, damit die resultierende Konfusionsmatrix leichter zu lesen ist.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)