Film incelemeleri için duygu analizi
Bu egzersizde, Large Movie Review Dataset veri kümesinin bir alt kümesinde lojistik regresyonun ürettiği olasılıkları keşfedeceksin.
X ve y değişkenleri ortama zaten yüklendi. X, film incelemelerinde kelimelerin kaç kez geçtiğine dayalı özellikleri içerir; y ise incelemenin duygu durumunun pozitif (+1) mi yoksa negatif (-1) mi olduğunu belirten etiketleri içerir.
Bu egzersiz
Python'da Lineer Sınıflandırıcılar
kursunun bir parçasıdırEgzersiz talimatları
- Film inceleme verileri üzerinde bir lojistik regresyon modeli eğit.
- Verilen iki inceleme için negatif ve pozitif olasılıklarını tahmin et.
- İstersen kendi incelemelerini yazıp onların olasılıklarını da alabilirsin!
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Instantiate logistic regression and train
lr = ____
lr.fit(____)
# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])
# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])