Análisis del sentimiento en las críticas de cine

En este ejercicio explorará las probabilidades obtenidas mediante regresión logística en un subconjunto del Gran Conjunto de Datos de Críticas de Películas.

Las variables X y y ya están cargadas en el entorno. X contiene características basadas en el número de veces que aparecen palabras en las críticas de películas, y y contiene etiquetas para indicar si el sentimiento de la crítica es positivo (+1) o negativo (-1).

Este ejercicio forma parte del curso

Clasificadores lineales en Python

Ver curso

Instrucciones de ejercicio

  • Entrenar un modelo de regresión logística con los datos de reseñas de películas.
  • Predecir las probabilidades de negativo frente a positivo para las dos reseñas dadas.
  • No dudes en escribir tus propias opiniones y obtener probabilidades para ellas también.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Instantiate logistic regression and train
lr = ____
lr.fit(____)

# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])

# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])