ComeçarComece de graça

Identificando as palavras mais positivas e mais negativas

Neste exercício, vamos tentar interpretar os coeficientes de uma regressão logística ajustada no conjunto de dados de sentimento de resenhas de filmes. O objeto do modelo já foi instanciado e ajustado para você na variável lr.

Além disso, as palavras correspondentes às diferentes features estão carregadas na variável vocab. Por exemplo, como vocab[100] é "think", isso significa que a feature 100 corresponde ao número de vezes que a palavra "think" apareceu naquela resenha de filme.

Este exercício faz parte do curso

Classificadores Lineares em Python

Ver curso

Instruções do exercício

  • Encontre as palavras correspondentes aos 5 maiores coeficientes.
  • Encontre as palavras correspondentes aos 5 menores coeficientes.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten()) 
inds_descending = inds_ascending[::-1]

# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")
Editar e executar o código