Comparar modelos con datos de reseñas etiquetados
Ahora que puedes clasificar sentimientos a gran escala, tu equipo quiere evaluar qué modelo es más fiable. Compararás dos modelos usando un conjunto de datos más grande de reseñas etiquetadas y medirás su accuracy.
Ya tienes precargadas una lista texts y sus true_labels.
Este ejercicio forma parte del curso
Natural Language Processing (NLP) en Python
ejercicio interactivo práctico
Prueba este ejercicio completando este código de ejemplo.
from transformers import pipeline
from sklearn.metrics import accuracy_score
# Load sentiment analysis models
pipe_a = pipeline(task="sentiment-analysis", ____)
pipe_b = pipeline(task="sentiment-analysis", ____)
# Generate predictions
preds_a = [____ for res in pipe_a(texts)]
preds_b = [____ for res in pipe_b(texts)]