Addestrare e testare il modello di "fake news" con CountVectorizer
Ora tocca a te addestrare il modello di "fake news" usando le feature che hai identificato ed estratto. In questo primo esercizio addestrerai e testerai un modello Naive Bayes usando i dati di CountVectorizer.
I set di training e test sono già stati creati e count_vectorizer, count_train e count_test sono stati calcolati.
Questo esercizio fa parte del corso
Introduzione al Natural Language Processing in Python
Istruzioni dell'esercizio
- Importa il modulo
metricsdasklearneMultinomialNBdasklearn.naive_bayes. - Istanzia un classificatore
MultinomialNBchiamatonb_classifier. - Addestra il classificatore sui dati di training.
- Calcola le etichette previste per i dati di test.
- Calcola e stampa l'accuracy del classificatore.
- Calcola la confusion matrix. Per renderla più leggibile, specifica l'argomento keyword
labels=['FAKE', 'REAL'].
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)