Entrenamiento y pruebas del modelo de "noticias falsas" con TfidfVectorizer
Ahora que has evaluado el modelo utilizando el CountVectorizer
, harás lo mismo utilizando el TfidfVectorizer
con un modelo Naive Bayes.
Se han creado los conjuntos de entrenamiento y de prueba, y se han calculado tfidf_vectorizer
, tfidf_train
y tfidf_test
. Además, MultinomialNB
y metrics
se han importado de, respectivamente, sklearn.naive_bayes
y sklearn
.
Este ejercicio forma parte del curso
Introducción al procesamiento de lenguaje natural en Python
Instrucciones de ejercicio
- Instanciar un clasificador
MultinomialNB
llamadonb_classifier
. - Ajusta el clasificador a los datos de entrenamiento.
- Calcula las etiquetas predichas para los datos de prueba.
- Calcula e imprime la puntuación de precisión del clasificador.
- Calcula la matriz de confusión. Como en el ejercicio anterior, especifica el argumento de la palabra clave
labels=['FAKE', 'REAL']
para que la matriz de confusión resultante sea más fácil de leer.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)