Logistic regression dengan data Twitter
Dalam latihan ini, Anda akan membangun model logistic regression menggunakan himpunan data tweets. Target diberikan oleh airline_sentiment, yang bernilai 0 untuk tweet negatif, 1 untuk netral, dan 2 untuk positif. Jadi, dalam kasus ini, Anda mengerjakan tugas klasifikasi multikelas. Semua yang kita pelajari tentang masalah biner juga berlaku untuk masalah klasifikasi multikelas.
Anda akan mengevaluasi akurasi model menggunakan dua pendekatan berbeda dari slide.
Fungsi logistic regression dan accuracy score telah diimpor untuk Anda.
Latihan ini adalah bagian dari kursus
Analisis Sentimen dengan Python
Petunjuk latihan
- Bangun dan latih model logistic regression menggunakan
Xdanyyang telah didefinisikan sebagai argumen. - Hitung akurasi model logistic regression.
- Prediksi labelnya.
- Hitung accuracy score menggunakan label prediksi dan label sebenarnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)
# Create an array of prediction
y_predict = log_reg.____
# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))