IniziaInizia gratis

Identificare le parole più positive e più negative

In questo esercizio proveremo a interpretare i coefficienti di una regressione logistica addestrata sul dataset di sentiment delle recensioni cinematografiche. L'oggetto del modello è già istanziato e addestrato per te nella variabile lr.

Inoltre, le parole corrispondenti alle diverse feature sono caricate nella variabile vocab. Per esempio, dato che vocab[100] è "think", significa che la feature 100 corrisponde al numero di volte in cui la parola "think" è apparsa in quella recensione del film.

Questo esercizio fa parte del corso

Classificatori lineari in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Trova le parole corrispondenti ai 5 coefficienti più grandi.
  • Trova le parole corrispondenti ai 5 coefficienti più piccoli.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten()) 
inds_descending = inds_ascending[::-1]

# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")
Modifica ed esegui il codice