ComenzarEmpieza gratis

Entrenar y probar el modelo de "fake news" con TfidfVectorizer

Ahora que has evaluado el modelo usando CountVectorizer, harás lo mismo usando TfidfVectorizer con un modelo de Naive Bayes.

Se han creado los conjuntos de entrenamiento y prueba, y se han calculado tfidf_vectorizer, tfidf_train y tfidf_test. Además, se han importado MultinomialNB y metrics de sklearn.naive_bayes y sklearn, respectivamente.

Este ejercicio forma parte del curso

Introducción al Natural Language Processing en Python

Ver curso

Instrucciones del ejercicio

  • Instancia un clasificador MultinomialNB llamado nb_classifier.
  • Ajusta el clasificador a los datos de entrenamiento.
  • Calcula las etiquetas predichas para los datos de prueba.
  • Calcula e imprime la puntuación de exactitud del clasificador.
  • Calcula la matriz de confusión. Como en el ejercicio anterior, especifica el argumento con nombre labels=['FAKE', 'REAL'] para que la matriz de confusión resultante sea más fácil de leer.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Editar y ejecutar código