Das „Fake News“-Modell mit CountVectorizer trainieren und testen
Jetzt liegt es an dir, das „Fake News“-Modell mit den von dir identifizierten und extrahierten Merkmalen zu trainieren. In dieser ersten Übung trainierst und testest du ein Naive-Bayes-Modell mit den CountVectorizer-Daten.
Die Trainings- und Testsets wurden erstellt, und count_vectorizer, count_train und count_test wurden berechnet.
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit Python
Anleitung zur Übung
- Importiere das Modul
metricsaussklearnundMultinomialNBaussklearn.naive_bayes. - Instanziiere einen
MultinomialNB-Klassifikator namensnb_classifier. - Fitte den Klassifikator auf die Trainingsdaten.
- Berechne die vorhergesagten Tags für die Testdaten.
- Berechne und gib die Genauigkeit des Klassifikators aus.
- Berechne die Konfusionsmatrix. Um sie leichter lesbar zu machen, gib das Schlüsselwortargument
labels=['FAKE', 'REAL']an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)