Regresión logística con datos de Twitter
En este ejercicio, construirás un modelo de regresión logística usando el conjunto de datos tweets. El objetivo está en airline_sentiment, que vale 0 para tuits negativos, 1 para neutros y 2 para positivos. Así que, en este caso, tienes una tarea de clasificación multiclase. Todo lo que aprendimos sobre problemas binarios también se aplica a problemas multiclase.
Evaluarás la exactitud del modelo usando los dos enfoques vistos en las diapositivas.
La función de regresión logística y la métrica de exactitud ya se han importado por ti.
Este ejercicio forma parte del curso
Sentiment Analysis in Python
Instrucciones del ejercicio
- Crea y ajusta un modelo de regresión logística usando los
Xyydefinidos como argumentos. - Calcula la exactitud del modelo de regresión logística.
- Predice las etiquetas.
- Calcula el accuracy score usando las etiquetas predichas y las verdaderas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)
# Create an array of prediction
y_predict = log_reg.____
# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))