Comparar modelos con datos de reseñas etiquetados
Ahora que puedes clasificar sentimientos a gran escala, tu equipo quiere evaluar qué modelo es más fiable. Compararás dos modelos usando un conjunto de datos más grande de reseñas etiquetadas y medirás su accuracy.
Ya tienes precargadas una lista texts y sus true_labels.
Este ejercicio forma parte del curso
Natural Language Processing (NLP) en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
from transformers import pipeline
from sklearn.metrics import accuracy_score
# Load sentiment analysis models
pipe_a = pipeline(task="sentiment-analysis", ____)
pipe_b = pipeline(task="sentiment-analysis", ____)
# Generate predictions
preds_a = [____ for res in pipe_a(texts)]
preds_b = [____ for res in pipe_b(texts)]