Identificar as palavras mais positivas e negativas
Neste exercício, tentaremos interpretar os coeficientes de um ajuste de regressão logística no conjunto de dados de sentimento de resenhas de filmes. O objeto do modelo já está instanciado e ajustado para você na variável lr
.
Além disso, as palavras correspondentes aos diferentes recursos são carregadas na variável vocab
. Por exemplo, como vocab[100]
é "think" (pensar), isso significa que o recurso 100 corresponde ao número de vezes que a palavra "think" apareceu na crítica do filme.
Este exercício faz parte do curso
Classificadores lineares em Python
Instruções de exercício
- Encontre as palavras correspondentes aos 5 maiores coeficientes.
- Encontre as palavras correspondentes aos 5 menores coeficientes.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten())
inds_descending = inds_ascending[::-1]
# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")
# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")