Identificar as palavras mais positivas e negativas

Neste exercício, tentaremos interpretar os coeficientes de um ajuste de regressão logística no conjunto de dados de sentimento de resenhas de filmes. O objeto do modelo já está instanciado e ajustado para você na variável lr.

Além disso, as palavras correspondentes aos diferentes recursos são carregadas na variável vocab. Por exemplo, como vocab[100] é "think" (pensar), isso significa que o recurso 100 corresponde ao número de vezes que a palavra "think" apareceu na crítica do filme.

Este exercício faz parte do curso

Classificadores lineares em Python

Ver Curso

Instruções de exercício

  • Encontre as palavras correspondentes aos 5 maiores coeficientes.
  • Encontre as palavras correspondentes aos 5 menores coeficientes.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten()) 
inds_descending = inds_ascending[::-1]

# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")