Mengidentifikasi kata paling positif dan negatif
Dalam latihan ini, kita akan mencoba menafsirkan koefisien dari regresi logistik yang dilatih pada himpunan data sentimen ulasan film. Objek model sudah diinstansiasi dan dilatih untuk Anda dalam variabel lr.
Selain itu, kata-kata yang berkaitan dengan berbagai fitur telah dimuat ke dalam variabel vocab. Sebagai contoh, karena vocab[100] adalah "think", itu berarti fitur ke-100 berkaitan dengan jumlah kemunculan kata "think" dalam ulasan film tersebut.
Latihan ini adalah bagian dari kursus
Klasifikator Linear di Python
Petunjuk latihan
- Temukan kata-kata yang berkaitan dengan 5 koefisien terbesar.
- Temukan kata-kata yang berkaitan dengan 5 koefisien terkecil.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the indices of the sorted cofficients
inds_ascending = np.argsort(lr.coef_.flatten())
inds_descending = inds_ascending[::-1]
# Print the most positive words
print("Most positive words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")
# Print most negative words
print("Most negative words: ", end="")
for i in range(5):
print(____, end=", ")
print("\n")