Identificare le parole più positive e più negative

In questo esercizio proveremo a interpretare i coefficienti di una regressione logistica addestrata sul dataset di sentiment delle recensioni cinematografiche. L'oggetto del modello è già istanziato e addestrato per te nella variabile lr.

Inoltre, le parole corrispondenti alle diverse feature sono caricate nella variabile vocab. Per esempio, dato che vocab[100] è "think", significa che la feature 100 corrisponde al numero di volte in cui la parola "think" è apparsa in quella recensione del film.

Questo esercizio fa parte del corso

Classificatori lineari in Python

Visualizza corso

Istruzioni dell'esercizio

Trova le parole corrispondenti ai 5 coefficienti più grandi.
Trova le parole corrispondenti ai 5 coefficienti più piccoli.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten()) 
inds_descending = inds_ascending[::-1]

# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

Modifica ed esegui il codice