Treinando e testando o modelo de "fake news" com TfidfVectorizer

Agora que você avaliou o modelo usando o CountVectorizer, vai fazer o mesmo usando o TfidfVectorizer com um modelo de Naive Bayes.

Os conjuntos de treino e teste já foram criados, e tfidf_vectorizer, tfidf_train e tfidf_test já foram calculados. Além disso, MultinomialNB e metrics foram importados de, respectivamente, sklearn.naive_bayes e sklearn.

Este exercicio faz parte do curso

Introdução ao Processamento de Linguagem Natural em Python

Ver curso

Instruções do exercicio

Instancie um classificador MultinomialNB chamado nb_classifier.
Ajuste o classificador aos dados de treino.
Calcule as tags previstas para os dados de teste.
Calcule e imprima a pontuação de acurácia do classificador.
Calcule a matriz de confusão. Como no exercício anterior, especifique o argumento nomeado labels=['FAKE', 'REAL'] para que a matriz de confusão resultante fique mais fácil de ler.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)

Editar e Executar Código