Construye y evalúa un modelo: datos de reseñas de productos

En este ejercicio, vas a construir una regresión logística usando el conjunto de datos reviews, que contiene reseñas de clientes sobre productos de Amazon. El array y contiene el sentimiento: 1 si es positivo y 0 en caso contrario. El array X contiene todas las características numéricas creadas con un enfoque BOW. Si quieres, explóralas en el IPython Shell.

Tu tarea es construir un modelo de regresión logística y calcular la accuracy y la matriz de confusión usando el conjunto de prueba.

La regresión logística y las funciones para dividir en entrenamiento/prueba ya se han importado por ti.

Este ejercicio forma parte del curso

Sentiment Analysis in Python

Ver curso

Instrucciones del ejercicio

Importa las funciones de accuracy y matriz de confusión.
Divide los datos en entrenamiento y prueba, usando el 30% como conjunto de prueba y establece la semilla aleatoria en 42.
Entrena un modelo de regresión logística.
Imprime la accuracy y la matriz de confusión usando los datos de prueba.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import the accuracy and confusion matrix
____

# Split the data into training and testing
X_train, X_test, y_train, y_test = ____(____, ____, ____=0.3, ____=42)

# Build a logistic regression
log_reg = ____._____

# Predict the labels 
y_predict = log_reg.predict(X_test)

# Print the performance metrics
print('Accuracy score of test data: ', ____(____, ____))
print('Confusion matrix of test data: \n', ____(____, ____)/len(y_test))

Editar y ejecutar código