Élimination récursive de variables (automatique)
Automatisons maintenant ce processus récursif. Enveloppez un éliminateur récursif de variables (RFE) autour de notre estimateur de régression logistique et indiquez-lui le nombre de variables souhaité.
Toutes les fonctions et bibliothèques nécessaires ont été préchargées et les variables explicatives ont été mises à l’échelle pour vous.
Cet exercice fait partie du cours
Réduction de dimension en Python
Instructions
- Créez le RFE avec un estimateur
LogisticRegression()et 3 variables à sélectionner. - Affichez les variables et leur classement.
- Affichez les variables qui ne sont pas éliminées.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the RFE with a LogisticRegression estimator and 3 features to select
rfe = ____(estimator=____, n_features_to_select=____, verbose=1)
# Fits the eliminator to the data
rfe.fit(X_train, y_train)
# Print the features and their ranking (high = dropped early on)
print(dict(zip(X.columns, rfe.____)))
# Print the features that are not eliminated
print(X.columns[rfe.____])
# Calculates the test set accuracy
acc = accuracy_score(y_test, rfe.predict(X_test))
print(f"{acc:.1%} accuracy on test set.")