Regressão logística usando dados do Twitter
Neste exercício, você vai construir um modelo de regressão logística usando o conjunto de dados tweets. O alvo é dado por airline_sentiment, que é 0 para tweets negativos, 1 para neutros e 2 para positivos. Portanto, neste caso, você tem uma tarefa de classificação multiclasse. Tudo o que aprendemos sobre problemas binários também se aplica a problemas de classificação multiclasse.
Você vai avaliar a acurácia do modelo usando as duas abordagens apresentadas nos slides.
A função de regressão logística e a função de acurácia já foram importadas para você.
Este exercício faz parte do curso
Análise de Sentimentos em Python
Instruções do exercício
- Construa e ajuste um modelo de regressão logística usando os
Xeydefinidos como argumentos. - Calcule a acurácia do modelo de regressão logística.
- Faça a predição dos rótulos.
- Calcule o accuracy score usando os rótulos previstos e verdadeiros.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)
# Create an array of prediction
y_predict = log_reg.____
# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))