Prediksi probabilitas ulasan film
Pada soal ini, Anda akan membangun logistic regression menggunakan himpunan data movies. Label disimpan dalam array y dan fitur dalam X.
Latih model pada data pelatihan. Alih-alih memprediksi kelas, prediksikan probabilitas bahwa setiap instance di himpunan data uji termasuk ke masing-masing dari dua kelas.
Fungsi logistic regression dan pemisahan train/test telah diimpor untuk Anda.
Latihan ini adalah bagian dari kursus
Analisis Sentimen dengan Python
Petunjuk latihan
- Bagi data menjadi himpunan pelatihan dan pengujian.
- Latih model logistic regression.
- Prediksi probabilitas untuk kelas 0 dan kelas 1 pada data pengujian. Kelas 0 berada pada kolom pertama dalam probabilitas yang diprediksi, dan kelas 1 berada pada kolom kedua.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Split into training and testing
X_train, X_test, y_train, y_test = ____(___, ___, test_size=0.2, random_state=321)
# Train a logistic regression
log_reg = ____.____
# Predict the probability of the 0 class
prob_0 = log_reg.____[:, ____]
# Predict the probability of the 1 class
prob_1 = log_reg.____[:, ____]
print("First 10 predicted probabilities of class 0: ", prob_0[:10])
print("First 10 predicted probabilities of class 1: ", prob_1[:10])