Treinamento e teste do modelo de "notícias falsas" com o TfidfVectorizer
Agora que você avaliou o modelo usando o CountVectorizer, fará o mesmo usando o TfidfVectorizer com um modelo Naive Bayes.
Os conjuntos de treinamento e teste foram criados, e tfidf_vectorizer, tfidf_train e tfidf_test foram computados. Além disso, MultinomialNB e metrics foram importados de, respectivamente, sklearn.naive_bayes e sklearn.
Este exercício faz parte do curso
Introdução ao processamento de linguagem natural em Python
Instruções do exercício
- Instanciar um classificador
MultinomialNBchamadonb_classifier. - Ajuste o classificador aos dados de treinamento.
- Calcule as tags previstas para os dados de teste.
- Calcule e imprima a pontuação de precisão do classificador.
- Calcule a matriz de confusão. Como no exercício anterior, especifique o argumento da palavra-chave
labels=['FAKE', 'REAL']para que a matriz de confusão resultante seja mais fácil de ler.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)