Entrenamiento y pruebas del modelo de "noticias falsas" con CountVectorizer
Ahora te toca entrenar el modelo de "noticias falsas" utilizando las características que has identificado y extraído. En este primer ejercicio entrenarás y probarás un modelo Naive Bayes utilizando los datos de CountVectorizer.
Se han creado los conjuntos de entrenamiento y de prueba, y se han calculado count_vectorizer, count_train y count_test.
Este ejercicio forma parte del curso
Introducción al procesamiento de lenguaje natural en Python
Instrucciones del ejercicio
- Importa el módulo
metricsdesklearnyMultinomialNBdesklearn.naive_bayes. - Instanciar un clasificador
MultinomialNBllamadonb_classifier. - Ajusta el clasificador a los datos de entrenamiento.
- Calcula las etiquetas predichas para los datos de prueba.
- Calcula e imprime la puntuación de precisión del clasificador.
- Calcula la matriz de confusión. Para facilitar la lectura, especifica el argumento de la palabra clave
labels=['FAKE', 'REAL'].
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)