MulaiMulai sekarang secara gratis

Mengidentifikasi kata paling positif dan negatif

Dalam latihan ini, kita akan mencoba menafsirkan koefisien dari regresi logistik yang dilatih pada himpunan data sentimen ulasan film. Objek model sudah diinstansiasi dan dilatih untuk Anda dalam variabel lr.

Selain itu, kata-kata yang berkaitan dengan berbagai fitur telah dimuat ke dalam variabel vocab. Sebagai contoh, karena vocab[100] adalah "think", itu berarti fitur ke-100 berkaitan dengan jumlah kemunculan kata "think" dalam ulasan film tersebut.

Latihan ini adalah bagian dari kursus

Klasifikator Linear di Python

Lihat Kursus

Petunjuk latihan

  • Temukan kata-kata yang berkaitan dengan 5 koefisien terbesar.
  • Temukan kata-kata yang berkaitan dengan 5 koefisien terkecil.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten()) 
inds_descending = inds_ascending[::-1]

# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")

# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
    print(____, end=", ")
print("\n")
Edit dan Jalankan Kode