Regresión logística con datos de Twitter

En este ejercicio, construirás un modelo de regresión logística usando el conjunto de datos tweets. El objetivo está en airline_sentiment, que vale 0 para tuits negativos, 1 para neutros y 2 para positivos. Así que, en este caso, tienes una tarea de clasificación multiclase. Todo lo que aprendimos sobre problemas binarios también se aplica a problemas multiclase.

Evaluarás la exactitud del modelo usando los dos enfoques vistos en las diapositivas.

La función de regresión logística y la métrica de exactitud ya se han importado por ti.

Este ejercicio forma parte del curso

Sentiment Analysis in Python

Ver curso

Instrucciones del ejercicio

Crea y ajusta un modelo de regresión logística usando los X y y definidos como argumentos.
Calcula la exactitud del modelo de regresión logística.
Predice las etiquetas.
Calcula el accuracy score usando las etiquetas predichas y las verdaderas.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)

# Create an array of prediction
y_predict = log_reg.____

# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))

Editar y ejecutar código