Entrenamiento y pruebas del modelo de "noticias falsas" con TfidfVectorizer

Ahora que has evaluado el modelo utilizando el CountVectorizer, harás lo mismo utilizando el TfidfVectorizer con un modelo Naive Bayes.

Se han creado los conjuntos de entrenamiento y de prueba, y se han calculado tfidf_vectorizer, tfidf_train y tfidf_test. Además, MultinomialNB y metrics se han importado de, respectivamente, sklearn.naive_bayes y sklearn.

Este ejercicio forma parte del curso

Introducción al procesamiento de lenguaje natural en Python

Ver curso

Instrucciones de ejercicio

  • Instanciar un clasificador MultinomialNB llamado nb_classifier.
  • Ajusta el clasificador a los datos de entrenamiento.
  • Calcula las etiquetas predichas para los datos de prueba.
  • Calcula e imprime la puntuación de precisión del clasificador.
  • Calcula la matriz de confusión. Como en el ejercicio anterior, especifica el argumento de la palabra clave labels=['FAKE', 'REAL'] para que la matriz de confusión resultante sea más fácil de leer.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)