Mengidentifikasi kata paling positif dan negatif
Dalam latihan ini, kita akan mencoba menafsirkan koefisien dari regresi logistik yang dilatih pada himpunan data sentimen ulasan film. Objek model sudah diinstansiasi dan dilatih untuk Anda dalam variabel lr.
Selain itu, kata-kata yang berkaitan dengan berbagai fitur telah dimuat ke dalam variabel vocab. Sebagai contoh, karena vocab[100] adalah "think", itu berarti fitur ke-100 berkaitan dengan jumlah kemunculan kata "think" dalam ulasan film tersebut.
Latihan ini merupakan bagian dari kursus
Klasifikator Linear di Python
Instruksi latihan
- Temukan kata-kata yang berkaitan dengan 5 koefisien terbesar.
- Temukan kata-kata yang berkaitan dengan 5 koefisien terkecil.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten())
inds_descending = inds_ascending[::-1]
# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")
# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")