Identificando as palavras mais positivas e mais negativas
Neste exercício, vamos tentar interpretar os coeficientes de uma regressão logística ajustada no conjunto de dados de sentimento de resenhas de filmes. O objeto do modelo já foi instanciado e ajustado para você na variável lr.
Além disso, as palavras correspondentes às diferentes features estão carregadas na variável vocab. Por exemplo, como vocab[100] é "think", isso significa que a feature 100 corresponde ao número de vezes que a palavra "think" apareceu naquela resenha de filme.
Este exercício faz parte do curso
Classificadores Lineares em Python
Instruções do exercício
- Encontre as palavras correspondentes aos 5 maiores coeficientes.
- Encontre as palavras correspondentes aos 5 menores coeficientes.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten())
inds_descending = inds_ascending[::-1]
# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")
# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")