Het "fake news"-model trainen en testen met CountVectorizer
Nu ben jij aan de beurt om het "fake news"-model te trainen met de kenmerken die je hebt geïdentificeerd en geëxtraheerd. In deze eerste oefening train en test je een Naive Bayes-model met de CountVectorizer-gegevens.
De trainings- en testsets zijn al gemaakt, en count_vectorizer, count_train en count_test zijn berekend.
Deze oefening maakt deel uit van de cursus
Introductie tot Natural Language Processing in Python
Oefeninstructies
- Importeer de module
metricsuitsklearnenMultinomialNBuitsklearn.naive_bayes. - Maak een
MultinomialNB-classifier met de naamnb_classifier. - Fit de classifier op de trainingsdata.
- Bereken de voorspelde labels voor de testdata.
- Bereken en print de nauwkeurigheid van de classifier.
- Bereken de confusion matrix. Maak deze leesbaarder door het keywordargument
labels=['FAKE', 'REAL']mee te geven.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)