Análise de sentimento para críticas de filmes

Neste exercício, você explorará as probabilidades geradas pela regressão logística em um subconjunto do Large Movie Review Dataset.

As variáveis X e y já estão carregadas no ambiente. X contém recursos baseados no número de vezes que as palavras aparecem nas resenhas de filmes, e y contém rótulos que indicam se o sentimento da resenha é positivo (+1) ou negativo (-1).

Este exercício faz parte do curso

Classificadores lineares em Python

Ver Curso

Instruções de exercício

  • Treine um modelo de regressão logística nos dados de resenhas de filmes.
  • Preveja as probabilidades de negativo vs. positivo para as duas avaliações fornecidas.
  • Fique à vontade para escrever suas próprias avaliações e obter probabilidades para elas também!

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Instantiate logistic regression and train
lr = ____
lr.fit(____)

# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])

# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])