Precision dan recall

Baik precision maupun recall terkait dengan empat kemungkinan keluaran yang dibahas pada pelajaran sebelumnya dan merupakan metrik evaluasi penting untuk model Machine Learning apa pun. Model CTR iklan idealnya memiliki precision tinggi (ROI tinggi untuk belanja iklan) dan recall tinggi (penargetan audiens yang relevan). Meskipun precision dan recall dapat dihitung secara manual, sklearn menyediakan implementasi praktis yang dapat Anda sambungkan dengan mudah ke alur kerja yang ada. Pada latihan ini, Anda akan menyiapkan decision tree dan menghitung precision serta recall.

Modul pandas tersedia sebagai pd di workspace Anda dan DataFrame contoh telah dimuat sebagai df. Fitur telah dimuat dalam X dan target telah dimuat dalam y untuk digunakan. Selain itu, precision_score() dan recall_score() dari sklearn.metrics tersedia.

Latihan ini merupakan bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

Instruksi latihan

Dapatkan pembagian data pelatihan dan pengujian untuk X dan y.
Definisikan classifier decision tree dan hasilkan prediksi y_pred dengan melatih modelnya.
Gunakan implementasi dari sklearn untuk memperoleh skor precision dan recall.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Set up training and testing split
X_train, X_test, y_train, y_test = ____(
  ____, ____, test_size = .2, random_state = 0)

# Create classifier and make predictions
clf = ____
y_pred = clf.____(____, _____).____(X_test) 

# Evaluate precision and recall
prec = ____(y_test, ____, average = 'weighted')
recall = ____(y_test, ____, average = 'weighted')
print("Precision: %s, Recall: %s" %(prec, recall))

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

SkillTag.level.intermediateSkillTag.label

4.9+

Mulai Kursus Gratis

Kemungkinan Anda berada di halaman ini karena Anda mengeklik sebuah tautan. Pada bab ini, Anda akan mempelajari mengapa click-through rate (CTR) penting untuk iklan tertarget, cara melakukan manipulasi DataFrame dasar, dan bagaimana Anda dapat menggunakan model machine learning untuk memprediksi CTR.

Exercise 1: Pendahuluan tentang click-through rate Exercise 2: Langkah awal Exercise 3: Eksplorasi fitur Exercise 4: Evaluasi awal data Exercise 5: Gambaran umum model Machine Learning Exercise 6: Regresi logistik untuk kanker payudara Exercise 7: Regresi logistik untuk citra Exercise 8: Model mainan kedua Exercise 9: Prediksi CTR menggunakan decision tree Exercise 10: Implementasi model Exercise 11: Model CTR pertama Exercise 12: Melampaui sekadar akurasi

Bab ini memberikan dasar-dasar exploratory data analysis (EDA). Dengan data contoh, Anda akan menggunakan pustaka pandas untuk meninjau kolom dan tipe data, mengeksplorasi data hilang, serta menggunakan hashing untuk melakukan rekayasa fitur pada fitur kategori. Semua ini penting saat mengeksplorasi fitur untuk prediksi CTR yang lebih akurat.

Exercise 1: Analisis data eksploratif Exercise 2: Tinjauan awal Exercise 3: Memeriksa nilai yang hilang Exercise 4: Distribusi menurut CTR Exercise 5: Rekayasa fitur Exercise 6: Menganalisis kolom datetime Exercise 7: Mengonversi variabel kategorikal Exercise 8: Membuat fitur baru Exercise 9: Menstandarkan fitur Exercise 10: Normalisasi log Exercise 11: Memahami standardisasi Exercise 12: Standard scaling

Saatnya menyelami lebih dalam. Pelajari bagaimana menggunakan ukuran kinerja model termasuk precision dan recall untuk menjawab pertanyaan dunia nyata, seperti mengevaluasi ROI pada belanja iklan. Anda juga akan mempelajari cara meningkatkan metrik evaluasi tersebut, seperti metode ensemble dan penalaan hyperparameter.

Exercise 1: Penerapan evaluasi metrik Exercise 2: Empat kategori keluaran Exercise 3: Evaluasi empat kategori Exercise 4: ROI pada belanja iklan Exercise 5: Evaluasi model Exercise 6: Precision dan recall

Latihan Saat Ini

Exercise 7: Garis Dasar Exercise 8: Perbandingan classifier Exercise 9: Melakukan tuning model Exercise 10: Regularisasi Exercise 11: Cross validation Exercise 12: Pemilihan model Exercise 13: Ansambel dan penyetelan hiperparameter Exercise 14: Memahami penyetelan hiperparameter Exercise 15: Random forest Exercise 16: Pencarian grid

Laba dapat sangat dipengaruhi oleh CTR kampanye Anda. Pada bab ini, Anda akan mempelajari bagaimana deep learning dapat digunakan untuk mengurangi risiko tersebut. Anda akan berfokus pada multi-layer perceptron (MLP) dan model neural network, serta mempelajari bagaimana model tersebut menangkap hubungan kompleks antarvariabel untuk memprediksi CTR dengan lebih akurat. Terakhir, Anda akan mengeksplorasi cara menerapkan dasar-dasar penalaan hyperparameter dan regularisasi pada model klasifikasi.

Exercise 1: Pengantar deep learning Exercise 2: Memahami MLP Exercise 3: Model awal Exercise 4: MLP untuk CTR Exercise 5: Penyetelan hyperparameter dalam deep learning Exercise 6: Penyetelan hiperparameter pada MLP Exercise 7: Memvariasikan hyperparameter Exercise 8: Grid Search MLP Exercise 9: Evaluasi model Exercise 10: Skor F-beta Exercise 11: Presisi rendah dan AUC tinggi Exercise 12: Precision, ROI, dan AUC Exercise 13: Tinjauan dan perbandingan model Exercise 14: Pemanasan perbandingan model Exercise 15: Mengevaluasi precision dan ROI Exercise 16: Penilaian total Exercise 17: Video penutup