ComeçarComece gratuitamente

Treinamento e teste do modelo de "notícias falsas" com o CountVectorizer

Agora é a sua vez de treinar o modelo de "notícias falsas" usando os recursos que você identificou e extraiu. Neste primeiro exercício, você treinará e testará um modelo Naive Bayes usando os dados do site CountVectorizer.

Os conjuntos de treinamento e teste foram criados, e count_vectorizer, count_train e count_test foram computados.

Este exercício faz parte do curso

Introdução ao processamento de linguagem natural em Python

Ver Curso

Instruções de exercício

  • Importe o módulo metrics de sklearn e MultinomialNB de sklearn.naive_bayes.
  • Instanciar um classificador MultinomialNB chamado nb_classifier.
  • Ajuste o classificador aos dados de treinamento.
  • Calcule as tags previstas para os dados de teste.
  • Calcule e imprima a pontuação de precisão do classificador.
  • Calcule a matriz de confusão. Para facilitar a leitura, especifique o argumento de palavra-chave labels=['FAKE', 'REAL'].

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import the necessary modules
____
____

# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Editar e executar código