Regularizar modelos con datos de Twitter
Trabajarás con datos de Twitter que expresan el sentimiento de clientes sobre aerolíneas. La matriz de características X y el vector de etiquetas y ya se han creado por ti. Además, ya se realizó la separación en entrenamiento y prueba, por lo que puedes usar directamente los arrays X_train, X_test, y_train y y_test.
Entrenarás modelos regularizados y otros más flexibles, y los evaluarás con diferentes métricas de rendimiento del modelo.
Todos los paquetes necesarios ya han sido importados.
Este ejercicio forma parte del curso
Sentiment Analysis in Python
Instrucciones del ejercicio
- Entrena dos regresiones logísticas: una con parámetro de regularización 100 y otra de 0.1.
- Imprime las puntuaciones de exactitud (accuracy) de ambos modelos.
- Imprime la matriz de confusión de cada modelo.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Build a logistic regression with regularizarion parameter of 100
log_reg1 = ____.____
# Build a logistic regression with regularizarion parameter of 0.1
log_reg2 = ____.____
# Predict the labels for each model
y_predict1 = log_reg1.predict(X_test)
y_predict2 = log_reg2.predict(X_test)
# Print performance metrics for each model
print('Accuracy of model 1: ', ____(____, ____))
print('Accuracy of model 2: ', ____(___, ____))
print('Confusion matrix of model 1: \n' , ____(____, ____)/len(y_test))
print('Confusion matrix of model 2: \n', ____(____, ____)/len(y_test))