CommencerCommencer gratuitement

Analyse de sentiment pour des critiques de films

Dans cet exercice, vous allez explorer les probabilités renvoyées par la régression logistique sur un sous-ensemble du Large Movie Review Dataset.

Les variables X et y sont déjà chargées dans l’environnement. X contient des caractéristiques basées sur le nombre d’occurrences des mots dans les critiques de films, et y contient les étiquettes indiquant si le sentiment de la critique est positif (+1) ou négatif (-1).

Cet exercice fait partie du cours

Classifieurs linéaires en Python

Afficher le cours

Instructions

  • Entraînez un modèle de régression logistique sur les données de critiques de films.
  • Prédisez les probabilités de négatif vs. positif pour les deux critiques fournies.
  • N’hésitez pas à écrire vos propres critiques et à obtenir aussi leurs probabilités !

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Instantiate logistic regression and train
lr = ____
lr.fit(____)

# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])

# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])
Modifier et exécuter le code