Training und Test des "Fake News"-Modells mit CountVectorizer
Jetzt bist du an der Reihe, das "Fake News"-Modell mit den Merkmalen zu trainieren, die du identifiziert und extrahiert hast. In dieser ersten Übung trainierst und testest du ein Naive Bayes-Modell mit den Daten von CountVectorizer
.
Die Trainings- und Testgruppen wurden erstellt und count_vectorizer
, count_train
und count_test
berechnet.
Diese Übung ist Teil des Kurses
Einführung in die natürliche Sprachverarbeitung in Python
Anleitung zur Übung
- Importiere das Modul
metrics
vonsklearn
undMultinomialNB
vonsklearn.naive_bayes
. - Erstelle einen
MultinomialNB
Klassifikator namensnb_classifier
. - Passe den Klassifikator an die Trainingsdaten an.
- Berechne die vorhergesagten Tags für die Testdaten.
- Berechne und drucke die Genauigkeit des Klassifikators.
- Berechne die Konfusionsmatrix. Um die Lesbarkeit zu verbessern, gibst du das Schlüsselwortargument
labels=['FAKE', 'REAL']
an.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)