Identificando as palavras mais positivas e mais negativas

Neste exercício, vamos tentar interpretar os coeficientes de uma regressão logística ajustada no conjunto de dados de sentimento de resenhas de filmes. O objeto do modelo já foi instanciado e ajustado para você na variável lr.

Além disso, as palavras correspondentes às diferentes features estão carregadas na variável vocab. Por exemplo, como vocab[100] é "think", isso significa que a feature 100 corresponde ao número de vezes que a palavra "think" apareceu naquela resenha de filme.

Este exercicio faz parte do curso

Classificadores Lineares em Python

Ver curso

Instruções do exercicio

Encontre as palavras correspondentes aos 5 maiores coeficientes.
Encontre as palavras correspondentes aos 5 menores coeficientes.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten()) 
inds_descending = inds_ascending[::-1]

# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

Editar e Executar Código