Training und Test des "Fake News"-Modells mit TfidfVectorizer
Nachdem du das Modell mit CountVectorizer
ausgewertet hast, machst du das Gleiche mit TfidfVectorizer
und einem Naive Bayes-Modell.
Die Trainings- und Testgruppen wurden erstellt und tfidf_vectorizer
, tfidf_train
und tfidf_test
berechnet. Außerdem wurden MultinomialNB
und metrics
von sklearn.naive_bayes
bzw. sklearn
importiert.
Diese Übung ist Teil des Kurses
Einführung in die natürliche Sprachverarbeitung in Python
Anleitung zur Übung
- Erstelle einen
MultinomialNB
Klassifikator namensnb_classifier
. - Passe den Klassifikator an die Trainingsdaten an.
- Berechne die vorhergesagten Tags für die Testdaten.
- Berechne und drucke die Genauigkeit des Klassifikators.
- Berechne die Konfusionsmatrix. Wie in der vorherigen Übung gibst du das Schlüsselwortargument
labels=['FAKE', 'REAL']
an, damit die resultierende Konfusionsmatrix leichter zu lesen ist.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)