Garis Dasar
Mengevaluasi sebuah classifier relatif terhadap garis dasar yang sesuai adalah hal yang penting. Ini sangat berlaku untuk himpunan data yang tidak seimbang, seperti klik iklan, karena akurasi tinggi dapat dengan mudah dicapai dengan selalu memilih kelas mayoritas. Dalam latihan ini, Anda akan mensimulasikan classifier garis dasar yang selalu memprediksi kelas mayoritas (tidak-klik) dan melihat confusion matrix-nya, serta berapa nilai precision dan recall-nya.
X_train, y_train, X_test, y_test tersedia di workspace Anda. pandas sebagai pd, numpy sebagai np, dan sklearn juga tersedia di workspace Anda.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Buat
y_predberupa array nol dengan panjang yang sama sepertiX_testmenggunakannp.asarray(). - Cetak confusion matrix yang dihasilkan.
- Dapatkan skor precision dan recall.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set up baseline predictions
y_pred = np.____([0 for x in range(len(X_test))])
# Look at confusion matrix
print("Confusion matrix: ")
print(____(y_test, y_pred))
# Check precision and recall
prec = ____(y_test, y_pred, average = 'weighted')
recall = ____(y_test, y_pred, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))