Menjelajahi koefisien regresi logistik
Sekarang Anda akan menelusuri koefisien regresi logistik untuk memahami faktor apa yang mendorong churn naik atau turun. Pada latihan ini, Anda akan mengekstrak koefisien regresi logistik dari model yang telah dipasangkan, dan menghitung eksponennya agar lebih mudah ditafsirkan.
Instance regresi logistik yang telah dipasangkan dimuat sebagai logreg dan fitur yang sudah diskalakan dimuat sebagai DataFrame pandas bernama train_X. Pustaka numpy dan pandas telah dimuat masing-masing sebagai np dan pd.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Petunjuk latihan
- Gabungkan nama fitur dan koefisien ke dalam sebuah DataFrame
pandas. - Hitung eksponen dari koefisien regresi logistik.
- Hapus koefisien yang bernilai sama dengan nol dan cetak dengan urutan berdasarkan koefisien eksponen.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Combine feature names and coefficients into pandas DataFrame
feature_names = pd.DataFrame(___.columns, columns = ['Feature'])
log_coef = pd.DataFrame(np.transpose(logreg.coef_), columns = ['Coefficient'])
coefficients = pd.concat([feature_names, ___], axis = 1)
# Calculate exponent of the logistic regression coefficients
coefficients['Exp_Coefficient'] = np.___(coefficients['Coefficient'])
# Remove coefficients that are equal to zero
coefficients = coefficients[coefficients['Coefficient']!=___]
# Print the values sorted by the exponent coefficient
print(coefficients.sort_values(by=['___']))