Análise de sentimento para críticas de filmes
Neste exercício, você explorará as probabilidades geradas pela regressão logística em um subconjunto do Large Movie Review Dataset.
As variáveis X
e y
já estão carregadas no ambiente. X
contém recursos baseados no número de vezes que as palavras aparecem nas resenhas de filmes, e y
contém rótulos que indicam se o sentimento da resenha é positivo (+1) ou negativo (-1).
Este exercício faz parte do curso
Classificadores lineares em Python
Instruções de exercício
- Treine um modelo de regressão logística nos dados de resenhas de filmes.
- Preveja as probabilidades de negativo vs. positivo para as duas avaliações fornecidas.
- Fique à vontade para escrever suas próprias avaliações e obter probabilidades para elas também!
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Instantiate logistic regression and train
lr = ____
lr.fit(____)
# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])
# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])