Regularisasi model dengan data Twitter
Anda akan bekerja dengan data Twitter yang mengekspresikan sentimen pelanggan tentang maskapai penerbangan. Matriks fitur X dan vektor label y telah dibuat untuk Anda. Selain itu, pemisahan data pelatihan dan pengujian telah dilakukan. Anda dapat langsung menggunakan array X_train, X_test, y_train dan y_test.
Anda akan melatih model yang diregularisasi dan model yang lebih fleksibel, lalu mengevaluasinya menggunakan berbagai metrik kinerja model.
Semua paket yang diperlukan telah diimpor untuk Anda.
Latihan ini adalah bagian dari kursus
Analisis Sentimen dengan Python
Petunjuk latihan
- Latih dua logistic regression: satu dengan parameter regularisasi 100 dan satu lagi 0,1.
- Cetak accuracy score dari kedua model.
- Cetak confusion matrix dari masing-masing model.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build a logistic regression with regularizarion parameter of 100
log_reg1 = ____.____
# Build a logistic regression with regularizarion parameter of 0.1
log_reg2 = ____.____
# Predict the labels for each model
y_predict1 = log_reg1.predict(X_test)
y_predict2 = log_reg2.predict(X_test)
# Print performance metrics for each model
print('Accuracy of model 1: ', ____(____, ____))
print('Accuracy of model 2: ', ____(___, ____))
print('Confusion matrix of model 1: \n' , ____(____, ____)/len(y_test))
print('Confusion matrix of model 2: \n', ____(____, ____)/len(y_test))