Reseñas de productos con regularización

En este ejercicio, volverás a trabajar con el conjunto de datos reviews de reseñas de productos de Amazon. Un vector de etiquetas y contiene el sentimiento: 1 si es positivo y 0 en caso contrario. La matriz X contiene todas las características numéricas creadas con un enfoque BOW.

Necesitarás entrenar dos modelos de regresión logística con distintos niveles de regularización y comparar su rendimiento en los datos de prueba. Recuerda que la regularización sirve para controlar la complejidad del modelo. Cuanto más regularizado está un modelo, menos flexible es, pero mejor puede generalizar. Los modelos con un mayor nivel de regularización suelen ser menos precisos que los no regularizados.

Este ejercicio forma parte del curso

Sentiment Analysis in Python

Ver curso

Instrucciones del ejercicio

Divide los datos en conjuntos de entrenamiento y prueba.
Entrena una regresión logística con parámetro de regularización 1000. Entrena una segunda regresión logística con parámetro de regularización igual a 0.001.
Imprime las puntuaciones de accuracy de ambos modelos en el conjunto de prueba.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Split data into training and testing
____, ____, ____, ____ = train_test_split(____, ____, test_size=0.2, random_state=123)

# Train a logistic regression with regularization of 1000
log_reg1 = ____(____=1000).fit(X_train, y_train)
# Train a logistic regression with regularization of 0.001
log_reg2 = ____(____=0.001).fit(X_train, y_train)

# Print the accuracies
print('Accuracy of model 1: ', log_reg1.____(____, ____))
print('Accuracy of model 2: ', log_reg2.____(____, ____))

Editar y ejecutar código