Addestrare e testare il modello di "fake news" con CountVectorizer

Ora tocca a te addestrare il modello di "fake news" usando le feature che hai identificato ed estratto. In questo primo esercizio addestrerai e testerai un modello Naive Bayes usando i dati di CountVectorizer.

I set di training e test sono già stati creati e count_vectorizer, count_train e count_test sono stati calcolati.

Questo esercizio fa parte del corso

Introduzione al Natural Language Processing in Python

Visualizza corso

Istruzioni dell'esercizio

Importa il modulo metrics da sklearn e MultinomialNB da sklearn.naive_bayes.
Istanzia un classificatore MultinomialNB chiamato nb_classifier.
Addestra il classificatore sui dati di training.
Calcola le etichette previste per i dati di test.
Calcola e stampa l'accuracy del classificatore.
Calcola la confusion matrix. Per renderla più leggibile, specifica l'argomento keyword labels=['FAKE', 'REAL'].

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import the necessary modules
____
____

# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)

Modifica ed esegui il codice