Identificare le parole più positive e più negative
In questo esercizio proveremo a interpretare i coefficienti di una regressione logistica addestrata sul dataset di sentiment delle recensioni cinematografiche. L'oggetto del modello è già istanziato e addestrato per te nella variabile lr.
Inoltre, le parole corrispondenti alle diverse feature sono caricate nella variabile vocab. Per esempio, dato che vocab[100] è "think", significa che la feature 100 corrisponde al numero di volte in cui la parola "think" è apparsa in quella recensione del film.
Questo esercizio fa parte del corso
Classificatori lineari in Python
Istruzioni dell'esercizio
- Trova le parole corrispondenti ai 5 coefficienti più grandi.
- Trova le parole corrispondenti ai 5 coefficienti più piccoli.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten())
inds_descending = inds_ascending[::-1]
# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")
# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")