Model CTR pertama
Dalam latihan ini, Anda akan membangun model CTR pertama pada himpunan data Avazu menggunakan decision tree dan mengevaluasi akurasi model menggunakan accuracy_score() dari sklearn. Selain itu, Anda akan menggunakan train_test_split() dari sklearn untuk membagi data latih dan uji alih-alih menentukan titik pembagian secara manual seperti sebelumnya.
Di ruang kerja Anda, data contoh dalam bentuk DataFrame dimuat sebagai df bersama dengan sklearn dan pandas sebagai pd.
Kita akan melakukan pembagian data latih dan uji secara dasar dan mengevaluasi hasilnya menggunakan akurasi.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Definisikan
Xdanymasing-masing sebagai fitur dan target berdasarkan kolomclick. - Bagi data menjadi himpunan latih dan uji menggunakan
train_test_split(X, y). - Buat classifier decision tree.
- Buat prediksi menggunakan classifier tersebut dan evaluasi akurasi prediksinya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.click
# Define training and testing
X_train, X_test, y_train, y_test = \
____(____, _____, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test)
print(____(y_test, y_pred))