Precision dan recall
Baik precision maupun recall terkait dengan empat kemungkinan keluaran yang dibahas pada pelajaran sebelumnya dan merupakan metrik evaluasi penting untuk model Machine Learning apa pun. Model CTR iklan idealnya memiliki precision tinggi (ROI tinggi untuk belanja iklan) dan recall tinggi (penargetan audiens yang relevan). Meskipun precision dan recall dapat dihitung secara manual, sklearn menyediakan implementasi praktis yang dapat Anda sambungkan dengan mudah ke alur kerja yang ada. Pada latihan ini, Anda akan menyiapkan decision tree dan menghitung precision serta recall.
Modul pandas tersedia sebagai pd di workspace Anda dan DataFrame contoh telah dimuat sebagai df. Fitur telah dimuat dalam X dan target telah dimuat dalam y untuk digunakan. Selain itu, precision_score() dan recall_score() dari sklearn.metrics tersedia.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Dapatkan pembagian data pelatihan dan pengujian untuk
Xdany. - Definisikan classifier decision tree dan hasilkan prediksi
y_preddengan melatih modelnya. - Gunakan implementasi dari
sklearnuntuk memperoleh skor precision dan recall.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
____, ____, test_size = .2, random_state = 0)
# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test)
# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))