Analisis sentimen untuk ulasan film
Dalam latihan ini Anda akan mengeksplorasi probabilitas yang dihasilkan oleh logistic regression pada subset Large Movie Review Dataset.
Variabel X dan y sudah dimuat ke dalam lingkungan. X berisi fitur berdasarkan jumlah kemunculan kata dalam ulasan film, dan y berisi label apakah sentimen ulasan tersebut positif (+1) atau negatif (-1).
Latihan ini adalah bagian dari kursus
Klasifikator Linear di Python
Petunjuk latihan
- Latih model logistic regression pada data ulasan film.
- Prediksi probabilitas negatif vs. positif untuk dua ulasan yang diberikan.
- Silakan tulis ulasan Anda sendiri dan dapatkan probabilitasnya juga!
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Instantiate logistic regression and train
lr = ____
lr.fit(____)
# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])
# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])