MulaiMulai sekarang secara gratis

Garis Dasar

Mengevaluasi sebuah classifier relatif terhadap garis dasar yang sesuai adalah hal yang penting. Ini sangat berlaku untuk himpunan data yang tidak seimbang, seperti klik iklan, karena akurasi tinggi dapat dengan mudah dicapai dengan selalu memilih kelas mayoritas. Dalam latihan ini, Anda akan mensimulasikan classifier garis dasar yang selalu memprediksi kelas mayoritas (tidak-klik) dan melihat confusion matrix-nya, serta berapa nilai precision dan recall-nya.

X_train, y_train, X_test, y_test tersedia di workspace Anda. pandas sebagai pd, numpy sebagai np, dan sklearn juga tersedia di workspace Anda.

Latihan ini adalah bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Buat y_pred berupa array nol dengan panjang yang sama seperti X_test menggunakan np.asarray().
  • Cetak confusion matrix yang dihasilkan.
  • Dapatkan skor precision dan recall.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Set up baseline predictions
y_pred = np.____([0 for x in range(len(X_test))])

# Look at confusion matrix
print("Confusion matrix: ")
print(____(y_test, y_pred))

# Check precision and recall
prec = ____(y_test, y_pred, average = 'weighted')
recall = ____(y_test, y_pred, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))
Edit dan Jalankan Kode