Regularisasi

Regularisasi adalah proses menambahkan informasi ke dalam model untuk mencegah overfitting. Hal ini penting untuk meningkatkan metrik evaluasi yang Anda lihat sebelumnya di bab ini. Pada latihan ini, Anda akan memvariasikan parameter kedalaman maksimum pada decision tree untuk melihat bagaimana hasil klasifikasi terpengaruh.

X_train, y_train, X_test, y_test tersedia di workspace Anda. pandas sebagai pd, numpy sebagai np, dan sklearn juga tersedia di workspace Anda. Selain itu, confusion_matrix(), precision_score(), dan recall_score() dari sklearn.metrics tersedia.

Latihan ini merupakan bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

Instruksi latihan

Buat beberapa decision tree dengan memvariasikan kedalaman maksimum tiap tree.
Untuk setiap tree, latih dan hasilkan prediksi pada data pengujian.
Evaluasi confusion matrix, precision, dan recall untuk setiap tree.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Iterate over different levels of max depth
for max_depth_val in [2, 3, 5, 10, 15, 20]:
  # Create and fit model
  clf = ____(____ = max_depth_val)
  print("Evaluating tree with max_depth = %s" %(max_depth_val))
  y_pred = clf.fit(____, ____).predict(____) 
  
  # Evaluate confusion matrix, precision, recall
  print("Confusion matrix: ")
  print(____(y_test, y_pred))
  prec = ____(____, ____, average = 'weighted')
  recall = ____(____, ____, average = 'weighted')
  print("Precision: %s, Recall: %s" %(prec, recall))

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

SkillTag.level.intermediateSkillTag.label

4.9+

Mulai Kursus Gratis

Kemungkinan Anda berada di halaman ini karena Anda mengeklik sebuah tautan. Pada bab ini, Anda akan mempelajari mengapa click-through rate (CTR) penting untuk iklan tertarget, cara melakukan manipulasi DataFrame dasar, dan bagaimana Anda dapat menggunakan model machine learning untuk memprediksi CTR.

Exercise 1: Pendahuluan tentang click-through rate Exercise 2: Langkah awal Exercise 3: Eksplorasi fitur Exercise 4: Evaluasi awal data Exercise 5: Gambaran umum model Machine Learning Exercise 6: Regresi logistik untuk kanker payudara Exercise 7: Regresi logistik untuk citra Exercise 8: Model mainan kedua Exercise 9: Prediksi CTR menggunakan decision tree Exercise 10: Implementasi model Exercise 11: Model CTR pertama Exercise 12: Melampaui sekadar akurasi

Bab ini memberikan dasar-dasar exploratory data analysis (EDA). Dengan data contoh, Anda akan menggunakan pustaka pandas untuk meninjau kolom dan tipe data, mengeksplorasi data hilang, serta menggunakan hashing untuk melakukan rekayasa fitur pada fitur kategori. Semua ini penting saat mengeksplorasi fitur untuk prediksi CTR yang lebih akurat.

Exercise 1: Analisis data eksploratif Exercise 2: Tinjauan awal Exercise 3: Memeriksa nilai yang hilang Exercise 4: Distribusi menurut CTR Exercise 5: Rekayasa fitur Exercise 6: Menganalisis kolom datetime Exercise 7: Mengonversi variabel kategorikal Exercise 8: Membuat fitur baru Exercise 9: Menstandarkan fitur Exercise 10: Normalisasi log Exercise 11: Memahami standardisasi Exercise 12: Standard scaling

Saatnya menyelami lebih dalam. Pelajari bagaimana menggunakan ukuran kinerja model termasuk precision dan recall untuk menjawab pertanyaan dunia nyata, seperti mengevaluasi ROI pada belanja iklan. Anda juga akan mempelajari cara meningkatkan metrik evaluasi tersebut, seperti metode ensemble dan penalaan hyperparameter.

Exercise 1: Penerapan evaluasi metrik Exercise 2: Empat kategori keluaran Exercise 3: Evaluasi empat kategori Exercise 4: ROI pada belanja iklan Exercise 5: Evaluasi model Exercise 6: Precision dan recall Exercise 7: Garis Dasar Exercise 8: Perbandingan classifier Exercise 9: Melakukan tuning model Exercise 10: Regularisasi

Latihan Saat Ini

Exercise 11: Cross validation Exercise 12: Pemilihan model Exercise 13: Ansambel dan penyetelan hiperparameter Exercise 14: Memahami penyetelan hiperparameter Exercise 15: Random forest Exercise 16: Pencarian grid

Laba dapat sangat dipengaruhi oleh CTR kampanye Anda. Pada bab ini, Anda akan mempelajari bagaimana deep learning dapat digunakan untuk mengurangi risiko tersebut. Anda akan berfokus pada multi-layer perceptron (MLP) dan model neural network, serta mempelajari bagaimana model tersebut menangkap hubungan kompleks antarvariabel untuk memprediksi CTR dengan lebih akurat. Terakhir, Anda akan mengeksplorasi cara menerapkan dasar-dasar penalaan hyperparameter dan regularisasi pada model klasifikasi.

Exercise 1: Pengantar deep learning Exercise 2: Memahami MLP Exercise 3: Model awal Exercise 4: MLP untuk CTR Exercise 5: Penyetelan hyperparameter dalam deep learning Exercise 6: Penyetelan hiperparameter pada MLP Exercise 7: Memvariasikan hyperparameter Exercise 8: Grid Search MLP Exercise 9: Evaluasi model Exercise 10: Skor F-beta Exercise 11: Presisi rendah dan AUC tinggi Exercise 12: Precision, ROI, dan AUC Exercise 13: Tinjauan dan perbandingan model Exercise 14: Pemanasan perbandingan model Exercise 15: Mengevaluasi precision dan ROI Exercise 16: Penilaian total Exercise 17: Video penutup