Análisis del sentimiento en las críticas de cine
En este ejercicio explorará las probabilidades obtenidas mediante regresión logística en un subconjunto del Gran Conjunto de Datos de Críticas de Películas.
Las variables X
y y
ya están cargadas en el entorno. X
contiene características basadas en el número de veces que aparecen palabras en las críticas de películas, y y
contiene etiquetas para indicar si el sentimiento de la crítica es positivo (+1) o negativo (-1).
Este ejercicio forma parte del curso
Clasificadores lineales en Python
Instrucciones de ejercicio
- Entrenar un modelo de regresión logística con los datos de reseñas de películas.
- Predecir las probabilidades de negativo frente a positivo para las dos reseñas dadas.
- No dudes en escribir tus propias opiniones y obtener probabilidades para ellas también.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Instantiate logistic regression and train
lr = ____
lr.fit(____)
# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])
# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])