Treinamento e teste do modelo de "notícias falsas" com o CountVectorizer
Agora é a sua vez de treinar o modelo de "notícias falsas" usando os recursos que você identificou e extraiu. Neste primeiro exercício, você treinará e testará um modelo Naive Bayes usando os dados do site CountVectorizer
.
Os conjuntos de treinamento e teste foram criados, e count_vectorizer
, count_train
e count_test
foram computados.
Este exercício faz parte do curso
Introdução ao processamento de linguagem natural em Python
Instruções de exercício
- Importe o módulo
metrics
desklearn
eMultinomialNB
desklearn.naive_bayes
. - Instanciar um classificador
MultinomialNB
chamadonb_classifier
. - Ajuste o classificador aos dados de treinamento.
- Calcule as tags previstas para os dados de teste.
- Calcule e imprima a pontuação de precisão do classificador.
- Calcule a matriz de confusão. Para facilitar a leitura, especifique o argumento de palavra-chave
labels=['FAKE', 'REAL']
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)