Perbandingan classifier
Kerangka ROI dapat dijalankan pada berbagai classifier untuk melihat bagaimana precision dan recall yang lebih tinggi menghasilkan nilai ROI yang lebih tinggi. Perhatikan bahwa classifier baseline yang Anda buat akan memiliki total pengembalian dan biaya sebesar 0 karena baik true positives tp maupun false positives fp akan 0 sesuai rancangan. Pada latihan ini, Anda akan menggunakan kerangka ROI untuk membandingkan classifier logistic regression dan decision tree.
X_train, y_train, X_test, y_test tersedia di workspace Anda, beserta pandas sebagai pd, numpy sebagai np. LogisticRegression() dari sklearn.linear_model juga tersedia.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create and fit classifier
clf = ____
y_pred = clf.____(X_train, y_train).____(X_test)
# Calculate total return, total spent, and ROI
r, cost = 0.2, 0.05
tn, fp, fn, tp = ____(y_test, y_pred).____
total_return = ____ * r
total_spent = (____ + ____) * cost
roi = total_return / total_spent
print("Total return: %s, Total spent: %s, ROI: %s" %(total_return, total_spent, roi))