Analyse de sentiment pour des critiques de films
Dans cet exercice, vous allez explorer les probabilités renvoyées par la régression logistique sur un sous-ensemble du Large Movie Review Dataset.
Les variables X et y sont déjà chargées dans l’environnement. X contient des caractéristiques basées sur le nombre d’occurrences des mots dans les critiques de films, et y contient les étiquettes indiquant si le sentiment de la critique est positif (+1) ou négatif (-1).
Cet exercice fait partie du cours
Classifieurs linéaires en Python
Instructions
- Entraînez un modèle de régression logistique sur les données de critiques de films.
- Prédisez les probabilités de négatif vs. positif pour les deux critiques fournies.
- N’hésitez pas à écrire vos propres critiques et à obtenir aussi leurs probabilités !
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Instantiate logistic regression and train
lr = ____
lr.fit(____)
# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])
# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])