Mengidentifikasi kata paling positif dan negatif

Dalam latihan ini, kita akan mencoba menafsirkan koefisien dari regresi logistik yang dilatih pada himpunan data sentimen ulasan film. Objek model sudah diinstansiasi dan dilatih untuk Anda dalam variabel lr.

Selain itu, kata-kata yang berkaitan dengan berbagai fitur telah dimuat ke dalam variabel vocab. Sebagai contoh, karena vocab[100] adalah "think", itu berarti fitur ke-100 berkaitan dengan jumlah kemunculan kata "think" dalam ulasan film tersebut.

Latihan ini merupakan bagian dari kursus

Klasifikator Linear di Python

Lihat Kursus

Instruksi latihan

Temukan kata-kata yang berkaitan dengan 5 koefisien terbesar.
Temukan kata-kata yang berkaitan dengan 5 koefisien terkecil.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten()) 
inds_descending = inds_ascending[::-1]

# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

Edit dan Jalankan Kode