Reseñas de productos con regularización
En este ejercicio, volverás a trabajar con el conjunto de datos reviews de reseñas de productos de Amazon. Un vector de etiquetas y contiene el sentimiento: 1 si es positivo y 0 en caso contrario. La matriz X contiene todas las características numéricas creadas con un enfoque BOW.
Necesitarás entrenar dos modelos de regresión logística con distintos niveles de regularización y comparar su rendimiento en los datos de prueba. Recuerda que la regularización sirve para controlar la complejidad del modelo. Cuanto más regularizado está un modelo, menos flexible es, pero mejor puede generalizar. Los modelos con un mayor nivel de regularización suelen ser menos precisos que los no regularizados.
Este ejercicio forma parte del curso
Sentiment Analysis in Python
Instrucciones del ejercicio
- Divide los datos en conjuntos de entrenamiento y prueba.
- Entrena una regresión logística con parámetro de regularización
1000. Entrena una segunda regresión logística con parámetro de regularización igual a0.001. - Imprime las puntuaciones de accuracy de ambos modelos en el conjunto de prueba.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Split data into training and testing
____, ____, ____, ____ = train_test_split(____, ____, test_size=0.2, random_state=123)
# Train a logistic regression with regularization of 1000
log_reg1 = ____(____=1000).fit(X_train, y_train)
# Train a logistic regression with regularization of 0.001
log_reg2 = ____(____=0.001).fit(X_train, y_train)
# Print the accuracies
print('Accuracy of model 1: ', log_reg1.____(____, ____))
print('Accuracy of model 2: ', log_reg2.____(____, ____))