MulaiMulai sekarang secara gratis

Bangun dan evaluasi model: data ulasan produk

Dalam latihan ini, Anda akan membangun logistic regression menggunakan himpunan data reviews, yang berisi ulasan pelanggan terhadap produk Amazon. Array y memuat sentimen: 1 jika positif dan 0 jika sebaliknya. Array X memuat semua fitur numerik yang dibuat menggunakan pendekatan BOW. Silakan eksplor di IPython Shell.

Tugas Anda adalah membangun model logistic regression dan menghitung akurasi serta confusion matrix menggunakan himpunan data uji.

Fungsi logistic regression dan pembagian latih/uji telah diimpor untuk Anda.

Latihan ini adalah bagian dari kursus

Analisis Sentimen dengan Python

Lihat Kursus

Petunjuk latihan

  • Impor fungsi accuracy score dan confusion matrix.
  • Bagi data menjadi latih dan uji, gunakan 30% sebagai himpunan uji dan tetapkan random seed ke 42.
  • Latih model logistic regression.
  • Cetak accuracy score dan confusion matrix menggunakan data uji.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the accuracy and confusion matrix
____

# Split the data into training and testing
X_train, X_test, y_train, y_test = ____(____, ____, ____=0.3, ____=42)

# Build a logistic regression
log_reg = ____._____

# Predict the labels 
y_predict = log_reg.predict(X_test)

# Print the performance metrics
print('Accuracy score of test data: ', ____(____, ____))
print('Confusion matrix of test data: \n', ____(____, ____)/len(y_test))
Edit dan Jalankan Kode