MulaiMulai sekarang secara gratis

Logistic regression dengan data Twitter

Dalam latihan ini, Anda akan membangun model logistic regression menggunakan himpunan data tweets. Target diberikan oleh airline_sentiment, yang bernilai 0 untuk tweet negatif, 1 untuk netral, dan 2 untuk positif. Jadi, dalam kasus ini, Anda mengerjakan tugas klasifikasi multikelas. Semua yang kita pelajari tentang masalah biner juga berlaku untuk masalah klasifikasi multikelas.

Anda akan mengevaluasi akurasi model menggunakan dua pendekatan berbeda dari slide.

Fungsi logistic regression dan accuracy score telah diimpor untuk Anda.

Latihan ini adalah bagian dari kursus

Analisis Sentimen dengan Python

Lihat Kursus

Petunjuk latihan

  • Bangun dan latih model logistic regression menggunakan X dan y yang telah didefinisikan sebagai argumen.
  • Hitung akurasi model logistic regression.
  • Prediksi labelnya.
  • Hitung accuracy score menggunakan label prediksi dan label sebenarnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define the vector of targets and matrix of features
y = tweets.airline_sentiment
X = tweets.drop('airline_sentiment', axis=1)

# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____)

# Create an array of prediction
y_predict = log_reg.____

# Print the accuracy using accuracy score
print('Accuracy of logistic regression: ', ____(___, ____))
Edit dan Jalankan Kode