Mengekstrak parameter Logistic Regression
Sekarang Anda akan berlatih mengekstrak sebuah parameter penting dari model logistic regression. Logistic regression memiliki beberapa parameter lain yang tidak dibahas di sini, namun Anda dapat meninjaunya di dokumentasi scikit-learn.org untuk modul LogisticRegression() pada bagian 'Attributes'.
Parameter ini penting untuk memahami arah dan besarnya pengaruh variabel terhadap target.
Dalam latihan ini kita akan mengekstrak parameter koefisien (terdapat pada atribut coef_), memasangkannya dengan nama kolom asli, dan melihat variabel mana yang memiliki pengaruh positif terbesar pada variabel target.
Anda akan memiliki:
- Objek model logistic regression bernama
log_reg_clf - DataFrame
X_train
sklearn dan pandas telah diimpor untuk Anda.
Latihan ini adalah bagian dari kursus
Penyetelan Hyperparameter di Python
Petunjuk latihan
- Buat daftar nama kolom asli yang digunakan dalam DataFrame pelatihan.
- Ekstrak koefisien dari estimator logistic regression.
- Buat DataFrame berisi koefisien dan nama variabel lalu tampilkan.
- Cetak 3 variabel 'positif' teratas berdasarkan besar koefisien.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a list of original variable names from the training DataFrame
original_variables = ____
# Extract the coefficients of the logistic regression estimator
model_coefficients = ____.____[____]
# Create a dataframe of the variables and coefficients & print it out
coefficient_df = pd.DataFrame({"Variable" : ____, "Coefficient": ____})
print(coefficient_df)
# Print out the top 3 positive variables
top_three_df = coefficient_df.sort_values(by=____, axis=0, ascending=____)[0:____]
print(top_three_df)