Lojistik Regresyon parametresi çıkarma
Şimdi lojistik regresyon modelinin önemli bir parametresini çıkarmayı pratiğe dökeceksin. Lojistik regresyonun burada incelemeyeceğin birkaç başka parametresi daha var; bunları LogisticRegression() modülündeki 'Attributes' bölümünde scikit-learn.org dokümantasyonundan gözden geçirebilirsin.
Bu parametre, değişkenlerin hedef üzerindeki etkinin yönünü ve büyüklüğünü anlamak için önemlidir.
Bu egzersizde katsayı (coefficient) parametresini (coef_ özniteliğinde bulunur) çıkaracağız, orijinal sütun adlarıyla eşleştirip hedef değişken üzerinde en büyük pozitif etkiye sahip değişkenleri göreceğiz.
Elinde olacaklar:
log_reg_clfadlı bir lojistik regresyon model nesnesiX_trainDataFrame'i
sklearn ve pandas senin için içe aktarıldı.
Bu egzersiz
Python'da Hiperparametre Ayarlama
kursunun bir parçasıdırEgzersiz talimatları
- Eğitim DataFrame'inde kullanılan orijinal sütun adlarının bir listesini oluştur.
- Lojistik regresyon tahmincisinin katsayılarını çıkar.
- Katsayılar ve değişken adlarından bir DataFrame oluştur ve görüntüle.
- Katsayı büyüklüğüne göre en 'pozitif' ilk 3 değişkeni yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a list of original variable names from the training DataFrame
original_variables = ____
# Extract the coefficients of the logistic regression estimator
model_coefficients = ____.____[____]
# Create a dataframe of the variables and coefficients & print it out
coefficient_df = pd.DataFrame({"Variable" : ____, "Coefficient": ____})
print(coefficient_df)
# Print out the top 3 positive variables
top_three_df = coefficient_df.sort_values(by=____, axis=0, ascending=____)[0:____]
print(top_three_df)