Régression logistique avec des données Twitter
Dans cet exercice, vous allez construire un modèle de régression logistique à partir du jeu de données tweets. La cible est donnée par airline_sentiment : 0 pour les tweets négatifs, 1 pour les neutres et 2 pour les positifs. Vous êtes donc face à une tâche de classification multiclasse. Tout ce que nous avons appris pour les problèmes binaires s’applique également aux problèmes de classification multiclasse.
Vous allez évaluer la précision du modèle en utilisant les deux approches présentées dans le diaporama.
La fonction de régression logistique et la fonction de calcul de la précision ont été importées pour vous.
Cet exercice fait partie du cours
Analyse de sentiments en Python
Instructions
- Créez et ajustez un modèle de régression logistique en utilisant
Xetytels que définis. - Calculez la précision du modèle de régression logistique.
- Prédisez les étiquettes.
- Calculez l’accuracy score à partir des étiquettes prédites et réelles.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)
# Create an array of prediction
y_predict = log_reg.____
# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))