Aan de slagGa gratis aan de slag

Het "fake news"-model trainen en testen met CountVectorizer

Nu ben jij aan de beurt om het "fake news"-model te trainen met de kenmerken die je hebt geïdentificeerd en geëxtraheerd. In deze eerste oefening train en test je een Naive Bayes-model met de CountVectorizer-gegevens.

De trainings- en testsets zijn al gemaakt, en count_vectorizer, count_train en count_test zijn berekend.

Deze oefening maakt deel uit van de cursus

Introductie tot Natural Language Processing in Python

Cursus bekijken

Oefeninstructies

  • Importeer de module metrics uit sklearn en MultinomialNB uit sklearn.naive_bayes.
  • Maak een MultinomialNB-classifier met de naam nb_classifier.
  • Fit de classifier op de trainingsdata.
  • Bereken de voorspelde labels voor de testdata.
  • Bereken en print de nauwkeurigheid van de classifier.
  • Bereken de confusion matrix. Maak deze leesbaarder door het keywordargument labels=['FAKE', 'REAL'] mee te geven.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the necessary modules
____
____

# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Code bewerken en uitvoeren