Training e test del modello di "fake news" con TfidfVectorizer

Ora che hai valutato il modello usando CountVectorizer, farai lo stesso usando TfidfVectorizer con un modello Naive Bayes.

I set di training e test sono già stati creati e tfidf_vectorizer, tfidf_train e tfidf_test sono stati calcolati. Inoltre, MultinomialNB e metrics sono stati importati rispettivamente da sklearn.naive_bayes e sklearn.

Questo esercizio fa parte del corso

Introduzione al Natural Language Processing in Python

Visualizza corso

Istruzioni dell'esercizio

Istanzia un classificatore MultinomialNB chiamato nb_classifier.
Adatta (fit) il classificatore ai dati di training.
Calcola le etichette previste per i dati di test.
Calcola e stampa l'accuracy del classificatore.
Calcola la matrice di confusione. Come nell'esercizio precedente, specifica l'argomento labels=['FAKE', 'REAL'] per rendere la matrice di confusione più leggibile.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)

Modifica ed esegui il codice