Het "fake news"-model trainen en testen met CountVectorizer

Nu ben jij aan de beurt om het "fake news"-model te trainen met de kenmerken die je hebt geïdentificeerd en geëxtraheerd. In deze eerste oefening train en test je een Naive Bayes-model met de CountVectorizer-gegevens.

De trainings- en testsets zijn al gemaakt, en count_vectorizer, count_train en count_test zijn berekend.

Deze oefening maakt deel uit van de cursus

Introductie tot Natural Language Processing in Python

Bekijk cursus

Oefeninstructies

Importeer de module metrics uit sklearn en MultinomialNB uit sklearn.naive_bayes.
Maak een MultinomialNB-classifier met de naam nb_classifier.
Fit de classifier op de trainingsdata.
Bereken de voorspelde labels voor de testdata.
Bereken en print de nauwkeurigheid van de classifier.
Bereken de confusion matrix. Maak deze leesbaarder door het keywordargument labels=['FAKE', 'REAL'] mee te geven.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import the necessary modules
____
____

# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)

Code bewerken en uitvoeren