Pemilihan model

Regularization dan cross validation adalah alat yang kuat dalam pemilihan model. Regularization dapat membantu mencegah overfitting dan cross validation memastikan model Anda dievaluasi dengan tepat. Pada latihan ini, Anda akan menggunakan regularization dan cross validation secara bersamaan dan melihat apakah model berbeda secara signifikan atau tidak. Anda hanya akan menghitung precision, meskipun latihan yang sama dapat dengan mudah dilakukan untuk recall dan metrik evaluasi lainnya juga.

X_train, y_train, X_test, y_test tersedia di workspace Anda. pandas sebagai pd, numpy sebagai np, dan sklearn juga tersedia di workspace Anda. Baik precision_score() maupun recall_score() dari sklearn.metrics tersedia, begitu pula KFold() dan cross_val_score() dari sklearn.model_selection.

Latihan ini merupakan bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

Instruksi latihan

Siapkan K-Fold cross validation dengan empat split menggunakan n_splits dan tetapkan ke k-fold.
Buat classifier decision tree.
Gunakan k_fold untuk menjalankan cross validation dan evaluasi precision dan recall model decision tree Anda untuk nilai max_depth yang diberikan.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Iterate over different levels of max depth and set up k-fold
for max_depth_val in [3, 5, 10]:
  k_fold = ____(____ = 4, random_state = 0, shuffle = True)
  clf = ____(____ = max_depth_val)
  print("Evaluating Decision Tree for max_depth = %s" %(max_depth_val))
  y_pred = clf.fit(____, ____).predict(____) 
  
  # Calculate precision for cross validation and test
  cv_precision = ____(
    ____, X_train, y_train, cv = k_fold, scoring = 'precision_weighted')
  precision = ____(y_test, y_pred, average = 'weighted')
  print("Cross validation Precision: %s" %(cv_precision))
  print("Test Precision: %s" %(precision))

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

SkillTag.level.intermediateSkillTag.label

4.9+

Mulai Kursus Gratis

Kemungkinan Anda berada di halaman ini karena Anda mengeklik sebuah tautan. Pada bab ini, Anda akan mempelajari mengapa click-through rate (CTR) penting untuk iklan tertarget, cara melakukan manipulasi DataFrame dasar, dan bagaimana Anda dapat menggunakan model machine learning untuk memprediksi CTR.

Exercise 1: Pendahuluan tentang click-through rate Exercise 2: Langkah awal Exercise 3: Eksplorasi fitur Exercise 4: Evaluasi awal data Exercise 5: Gambaran umum model Machine Learning Exercise 6: Regresi logistik untuk kanker payudara Exercise 7: Regresi logistik untuk citra Exercise 8: Model mainan kedua Exercise 9: Prediksi CTR menggunakan decision tree Exercise 10: Implementasi model Exercise 11: Model CTR pertama Exercise 12: Melampaui sekadar akurasi

Bab ini memberikan dasar-dasar exploratory data analysis (EDA). Dengan data contoh, Anda akan menggunakan pustaka pandas untuk meninjau kolom dan tipe data, mengeksplorasi data hilang, serta menggunakan hashing untuk melakukan rekayasa fitur pada fitur kategori. Semua ini penting saat mengeksplorasi fitur untuk prediksi CTR yang lebih akurat.

Exercise 1: Analisis data eksploratif Exercise 2: Tinjauan awal Exercise 3: Memeriksa nilai yang hilang Exercise 4: Distribusi menurut CTR Exercise 5: Rekayasa fitur Exercise 6: Menganalisis kolom datetime Exercise 7: Mengonversi variabel kategorikal Exercise 8: Membuat fitur baru Exercise 9: Menstandarkan fitur Exercise 10: Normalisasi log Exercise 11: Memahami standardisasi Exercise 12: Standard scaling

Saatnya menyelami lebih dalam. Pelajari bagaimana menggunakan ukuran kinerja model termasuk precision dan recall untuk menjawab pertanyaan dunia nyata, seperti mengevaluasi ROI pada belanja iklan. Anda juga akan mempelajari cara meningkatkan metrik evaluasi tersebut, seperti metode ensemble dan penalaan hyperparameter.

Exercise 1: Penerapan evaluasi metrik Exercise 2: Empat kategori keluaran Exercise 3: Evaluasi empat kategori Exercise 4: ROI pada belanja iklan Exercise 5: Evaluasi model Exercise 6: Precision dan recall Exercise 7: Garis Dasar Exercise 8: Perbandingan classifier Exercise 9: Melakukan tuning model Exercise 10: Regularisasi Exercise 11: Cross validation Exercise 12: Pemilihan model

Latihan Saat Ini

Exercise 13: Ansambel dan penyetelan hiperparameter Exercise 14: Memahami penyetelan hiperparameter Exercise 15: Random forest Exercise 16: Pencarian grid

Laba dapat sangat dipengaruhi oleh CTR kampanye Anda. Pada bab ini, Anda akan mempelajari bagaimana deep learning dapat digunakan untuk mengurangi risiko tersebut. Anda akan berfokus pada multi-layer perceptron (MLP) dan model neural network, serta mempelajari bagaimana model tersebut menangkap hubungan kompleks antarvariabel untuk memprediksi CTR dengan lebih akurat. Terakhir, Anda akan mengeksplorasi cara menerapkan dasar-dasar penalaan hyperparameter dan regularisasi pada model klasifikasi.

Exercise 1: Pengantar deep learning Exercise 2: Memahami MLP Exercise 3: Model awal Exercise 4: MLP untuk CTR Exercise 5: Penyetelan hyperparameter dalam deep learning Exercise 6: Penyetelan hiperparameter pada MLP Exercise 7: Memvariasikan hyperparameter Exercise 8: Grid Search MLP Exercise 9: Evaluasi model Exercise 10: Skor F-beta Exercise 11: Presisi rendah dan AUC tinggi Exercise 12: Precision, ROI, dan AUC Exercise 13: Tinjauan dan perbandingan model Exercise 14: Pemanasan perbandingan model Exercise 15: Mengevaluasi precision dan ROI Exercise 16: Penilaian total Exercise 17: Video penutup