ComeçarComece de graça

Regressão logística usando dados do Twitter

Neste exercício, você vai construir um modelo de regressão logística usando o conjunto de dados tweets. O alvo é dado por airline_sentiment, que é 0 para tweets negativos, 1 para neutros e 2 para positivos. Portanto, neste caso, você tem uma tarefa de classificação multiclasse. Tudo o que aprendemos sobre problemas binários também se aplica a problemas de classificação multiclasse.

Você vai avaliar a acurácia do modelo usando as duas abordagens apresentadas nos slides.

A função de regressão logística e a função de acurácia já foram importadas para você.

Este exercício faz parte do curso

Análise de Sentimentos em Python

Ver curso

Instruções do exercício

  • Construa e ajuste um modelo de regressão logística usando os X e y definidos como argumentos.
  • Calcule a acurácia do modelo de regressão logística.
  • Faça a predição dos rótulos.
  • Calcule o accuracy score usando os rótulos previstos e verdadeiros.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)

# Create an array of prediction
y_predict = log_reg.____

# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))
Editar e executar o código