ComenzarEmpieza gratis

Entrenamiento y pruebas del modelo de "noticias falsas" con CountVectorizer

Ahora te toca entrenar el modelo de "noticias falsas" utilizando las características que has identificado y extraído. En este primer ejercicio entrenarás y probarás un modelo Naive Bayes utilizando los datos de CountVectorizer.

Se han creado los conjuntos de entrenamiento y de prueba, y se han calculado count_vectorizer, count_train y count_test.

Este ejercicio forma parte del curso

Introducción al procesamiento de lenguaje natural en Python

Ver curso

Instrucciones del ejercicio

  • Importa el módulo metrics de sklearn y MultinomialNB de sklearn.naive_bayes.
  • Instanciar un clasificador MultinomialNB llamado nb_classifier.
  • Ajusta el clasificador a los datos de entrenamiento.
  • Calcula las etiquetas predichas para los datos de prueba.
  • Calcula e imprime la puntuación de precisión del clasificador.
  • Calcula la matriz de confusión. Para facilitar la lectura, especifica el argumento de la palabra clave labels=['FAKE', 'REAL'].

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Import the necessary modules
____
____

# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Editar y ejecutar código