Régression logistique avec des données Twitter

Dans cet exercice, vous allez construire un modèle de régression logistique à partir du jeu de données tweets. La cible est donnée par airline_sentiment : 0 pour les tweets négatifs, 1 pour les neutres et 2 pour les positifs. Vous êtes donc face à une tâche de classification multiclasse. Tout ce que nous avons appris pour les problèmes binaires s’applique également aux problèmes de classification multiclasse.

Vous allez évaluer la précision du modèle en utilisant les deux approches présentées dans le diaporama.

La fonction de régression logistique et la fonction de calcul de la précision ont été importées pour vous.

Cet exercice fait partie du cours

<cours>Analyse de sentiments en Python</cours>

Voir le cours

Instructions de l’exercice

Créez et ajustez un modèle de régression logistique en utilisant X et y tels que définis.
Calculez la précision du modèle de régression logistique.
Prédisez les étiquettes.
Calculez l’accuracy score à partir des étiquettes prédites et réelles.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)

# Create an array of prediction
y_predict = log_reg.____

# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))

Modifier et exécuter le code