Regresión logística de reseñas de películas
En el vídeo vimos que la regresión logística es una forma habitual de modelar tareas de clasificación, como clasificar el sentimiento en positivo o negativo.
En este ejercicio trabajarás con el conjunto de datos de reseñas movies. La columna label almacena el sentimiento: vale 1 cuando la reseña es positiva y 0 cuando es negativa. La reseña de texto se ha transformado con BOW a columnas numéricas.
Tu tarea es construir un modelo de regresión logística usando el conjunto de datos movies y calcular su exactitud.
Este ejercicio forma parte del curso
Sentiment Analysis in Python
Instrucciones del ejercicio
- Importa la función de regresión logística.
- Crea y ajusta una regresión logística con las etiquetas
yy las característicasX. - Calcula la exactitud del modelo de regresión logística usando el método predeterminado
.score().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the logistic regression
from ____.____ import ____
# Define the vector of targets and matrix of features
y = movies.label
X = movies.drop('label', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____(X, y))