CommencerCommencez gratuitement

Régression logistique sur des critiques de films

Dans la vidéo, nous avons vu que la régression logistique est une méthode courante pour modéliser une tâche de classification, comme déterminer si un sentiment est positif ou négatif.

Dans cet exercice, vous allez travailler avec le jeu de données de critiques movies. La colonne label contient le sentiment : 1 lorsque la critique est positive, et 0 lorsqu’elle est négative. Le texte de la critique a été transformé en colonnes numériques à l’aide du modèle « bag of words » (BOW).

Votre objectif est de construire un modèle de régression logistique avec le jeu de données movies et d’en calculer la précision.

Cet exercice fait partie du cours

<cours>Analyse de sentiments en Python</cours>
Voir le cours

Instructions de l’exercice

  • Importez la fonction de régression logistique.
  • Créez et ajustez une régression logistique sur les étiquettes y et les caractéristiques X.
  • Calculez la précision du modèle de régression logistique à l’aide de la méthode par défaut .score().

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import the logistic regression
from ____.____ import ____

# Define the vector of targets and matrix of features
y = movies.label
X = movies.drop('label', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____(X, y))
Modifier et exécuter le code