Explorer les coefficients de la régression logistique
Vous allez maintenant explorer les coefficients de la régression logistique pour comprendre ce qui fait augmenter ou diminuer le churn. Dans cet exercice, vous allez extraire les coefficients de régression logistique du modèle entraîné, puis calculer leur exponentielle pour faciliter l’interprétation.
L’instance de régression logistique entraînée est chargée sous le nom logreg et les variables mises à l’échelle sont disponibles dans un DataFrame pandas appelé train_X. Les bibliothèques numpy et pandas sont chargées sous les alias np et pd respectivement.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Combinez les noms des variables et les coefficients dans un DataFrame
pandas. - Calculez l’exponentielle des coefficients de la régression logistique.
- Supprimez les coefficients égaux à zéro et affichez-les triés par le coefficient exponentié.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Combine feature names and coefficients into pandas DataFrame
feature_names = pd.DataFrame(___.columns, columns = ['Feature'])
log_coef = pd.DataFrame(np.transpose(logreg.coef_), columns = ['Coefficient'])
coefficients = pd.concat([feature_names, ___], axis = 1)
# Calculate exponent of the logistic regression coefficients
coefficients['Exp_Coefficient'] = np.___(coefficients['Coefficient'])
# Remove coefficients that are equal to zero
coefficients = coefficients[coefficients['Coefficient']!=___]
# Print the values sorted by the exponent coefficient
print(coefficients.sort_values(by=['___']))