Explorer les coefficients de la régression logistique

Vous allez maintenant explorer les coefficients de la régression logistique pour comprendre ce qui fait augmenter ou diminuer le churn. Dans cet exercice, vous allez extraire les coefficients de régression logistique du modèle entraîné, puis calculer leur exponentielle pour faciliter l’interprétation.

L’instance de régression logistique entraînée est chargée sous le nom logreg et les variables mises à l’échelle sont disponibles dans un DataFrame pandas appelé train_X. Les bibliothèques numpy et pandas sont chargées sous les alias np et pd respectivement.

Cet exercice fait partie du cours

Machine Learning pour le marketing en Python

Afficher le cours

Instructions

Combinez les noms des variables et les coefficients dans un DataFrame pandas.
Calculez l’exponentielle des coefficients de la régression logistique.
Supprimez les coefficients égaux à zéro et affichez-les triés par le coefficient exponentié.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Combine feature names and coefficients into pandas DataFrame
feature_names = pd.DataFrame(___.columns, columns = ['Feature'])
log_coef = pd.DataFrame(np.transpose(logreg.coef_), columns = ['Coefficient'])
coefficients = pd.concat([feature_names, ___], axis = 1)

# Calculate exponent of the logistic regression coefficients
coefficients['Exp_Coefficient'] = np.___(coefficients['Coefficient'])

# Remove coefficients that are equal to zero
coefficients = coefficients[coefficients['Coefficient']!=___]

# Print the values sorted by the exponent coefficient
print(coefficients.sort_values(by=['___']))

Modifier et exécuter le code