Construye y evalúa un modelo: datos de reseñas de productos
En este ejercicio, vas a construir una regresión logística usando el conjunto de datos reviews, que contiene reseñas de clientes sobre productos de Amazon. El array y contiene el sentimiento: 1 si es positivo y 0 en caso contrario. El array X contiene todas las características numéricas creadas con un enfoque BOW. Si quieres, explóralas en el IPython Shell.
Tu tarea es construir un modelo de regresión logística y calcular la accuracy y la matriz de confusión usando el conjunto de prueba.
La regresión logística y las funciones para dividir en entrenamiento/prueba ya se han importado por ti.
Este ejercicio forma parte del curso
Sentiment Analysis in Python
Instrucciones del ejercicio
- Importa las funciones de accuracy y matriz de confusión.
- Divide los datos en entrenamiento y prueba, usando el 30% como conjunto de prueba y establece la semilla aleatoria en
42. - Entrena un modelo de regresión logística.
- Imprime la accuracy y la matriz de confusión usando los datos de prueba.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the accuracy and confusion matrix
____
# Split the data into training and testing
X_train, X_test, y_train, y_test = ____(____, ____, ____=0.3, ____=42)
# Build a logistic regression
log_reg = ____._____
# Predict the labels
y_predict = log_reg.predict(X_test)
# Print the performance metrics
print('Accuracy score of test data: ', ____(____, ____))
print('Confusion matrix of test data: \n', ____(____, ____)/len(y_test))