Régression logistique sur des critiques de films
Dans la vidéo, nous avons vu que la régression logistique est une méthode courante pour modéliser une tâche de classification, comme déterminer si un sentiment est positif ou négatif.
Dans cet exercice, vous allez travailler avec le jeu de données de critiques movies. La colonne label contient le sentiment : 1 lorsque la critique est positive, et 0 lorsqu’elle est négative. Le texte de la critique a été transformé en colonnes numériques à l’aide du modèle « bag of words » (BOW).
Votre objectif est de construire un modèle de régression logistique avec le jeu de données movies et d’en calculer la précision.
Cet exercice fait partie du cours
Analyse de sentiments en Python
Instructions
- Importez la fonction de régression logistique.
- Créez et ajustez une régression logistique sur les étiquettes
yet les caractéristiquesX. - Calculez la précision du modèle de régression logistique à l’aide de la méthode par défaut
.score().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the logistic regression
from ____.____ import ____
# Define the vector of targets and matrix of features
y = movies.label
X = movies.drop('label', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____(X, y))