Training e test del modello di "fake news" con TfidfVectorizer
Ora che hai valutato il modello usando CountVectorizer, farai lo stesso usando TfidfVectorizer con un modello Naive Bayes.
I set di training e test sono già stati creati e tfidf_vectorizer, tfidf_train e tfidf_test sono stati calcolati. Inoltre, MultinomialNB e metrics sono stati importati rispettivamente da sklearn.naive_bayes e sklearn.
Questo esercizio fa parte del corso
Introduzione al Natural Language Processing in Python
Istruzioni dell'esercizio
- Istanzia un classificatore
MultinomialNBchiamatonb_classifier. - Adatta (fit) il classificatore ai dati di training.
- Calcola le etichette previste per i dati di test.
- Calcola e stampa l'accuracy del classificatore.
- Calcola la matrice di confusione. Come nell'esercizio precedente, specifica l'argomento
labels=['FAKE', 'REAL']per rendere la matrice di confusione più leggibile.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)