Mulai sekarangMulai gratis

Bangun dan evaluasi model: data ulasan produk

Dalam latihan ini, Anda akan membangun logistic regression menggunakan himpunan data reviews, yang berisi ulasan pelanggan terhadap produk Amazon. Array y memuat sentimen: 1 jika positif dan 0 jika sebaliknya. Array X memuat semua fitur numerik yang dibuat menggunakan pendekatan BOW. Silakan eksplor di IPython Shell.

Tugas Anda adalah membangun model logistic regression dan menghitung akurasi serta confusion matrix menggunakan himpunan data uji.

Fungsi logistic regression dan pembagian latih/uji telah diimpor untuk Anda.

Latihan ini merupakan bagian dari kursus

Analisis Sentimen dengan Python

Lihat Kursus

Instruksi latihan

  • Impor fungsi accuracy score dan confusion matrix.
  • Bagi data menjadi latih dan uji, gunakan 30% sebagai himpunan uji dan tetapkan random seed ke 42.
  • Latih model logistic regression.
  • Cetak accuracy score dan confusion matrix menggunakan data uji.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import the accuracy and confusion matrix
____

# Split the data into training and testing
X_train, X_test, y_train, y_test = ____(____, ____, ____=0.3, ____=42)

# Build a logistic regression
log_reg = ____._____

# Predict the labels 
y_predict = log_reg.predict(X_test)

# Print the performance metrics
print('Accuracy score of test data: ', ____(____, ____))
print('Confusion matrix of test data: \n', ____(____, ____)/len(y_test))
Edit dan Jalankan Kode