IniziaInizia gratis

Training e test del modello di "fake news" con TfidfVectorizer

Ora che hai valutato il modello usando CountVectorizer, farai lo stesso usando TfidfVectorizer con un modello Naive Bayes.

I set di training e test sono già stati creati e tfidf_vectorizer, tfidf_train e tfidf_test sono stati calcolati. Inoltre, MultinomialNB e metrics sono stati importati rispettivamente da sklearn.naive_bayes e sklearn.

Questo esercizio fa parte del corso

Introduzione al Natural Language Processing in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Istanzia un classificatore MultinomialNB chiamato nb_classifier.
  • Adatta (fit) il classificatore ai dati di training.
  • Calcola le etichette previste per i dati di test.
  • Calcola e stampa l'accuracy del classificatore.
  • Calcola la matrice di confusione. Come nell'esercizio precedente, specifica l'argomento labels=['FAKE', 'REAL'] per rendere la matrice di confusione più leggibile.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Modifica ed esegui il codice