Prédire des probabilités pour des critiques de films
Dans cet exercice, vous allez construire une régression logistique en utilisant le jeu de données movies. Les étiquettes sont stockées dans le tableau y et les variables explicatives dans X.
Entraînez le modèle sur les données d’entraînement. Au lieu de prédire des classes, prédisez les probabilités que chaque instance de l’ensemble de test appartienne à chacune des deux classes.
La régression logistique et les fonctions de séparation entraînement/test ont été importées pour vous.
Cet exercice fait partie du cours
Analyse de sentiments en Python
Instructions
- Séparez les données en un ensemble d’entraînement et un ensemble de test.
- Entraînez un modèle de régression logistique.
- Prédisez les probabilités pour la classe 0 et pour la classe 1 sur les données de test. La classe 0 correspond à la première colonne des probabilités prédites, et la classe 1 à la deuxième.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Split into training and testing
X_train, X_test, y_train, y_test = ____(___, ___, test_size=0.2, random_state=321)
# Train a logistic regression
log_reg = ____.____
# Predict the probability of the 0 class
prob_0 = log_reg.____[:, ____]
# Predict the probability of the 1 class
prob_1 = log_reg.____[:, ____]
print("First 10 predicted probabilities of class 0: ", prob_0[:10])
print("First 10 predicted probabilities of class 1: ", prob_1[:10])