Résultats du modèle Lasso
Maintenant que vous avez entraîné le modèle Lasso, vous allez évaluer sa capacité de prédiction (\(R^2\)) sur l’ensemble de test et compter combien de variables sont ignorées parce que leur coefficient est ramené à zéro.
Les jeux de données X_test et y_test ont été préchargés pour vous.
Le modèle Lasso() et le StandardScaler() ont été instanciés sous les noms la et scaler respectivement, et tous deux ont été ajustés sur les données d’entraînement.
Cet exercice fait partie du cours
Réduction de dimension en Python
Instructions
- Transformez l’ensemble de test avec le scaler déjà ajusté.
- Calculez la valeur \(R^2\) sur les données de test mises à l’échelle.
- Créez une liste qui contient True quand les coefficients sont égaux à 0.
- Calculez le nombre total de variables dont le coefficient est égal à 0.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Transform the test set with the pre-fitted scaler
X_test_std = scaler.____
# Calculate the coefficient of determination (R squared) on X_test_std
r_squared = la.____(____, ____)
print(f"The model can predict {r_squared:.1%} of the variance in the test set.")
# Create a list that has True values when coefficients equal 0
zero_coef = la.____ == ____
# Calculate how many features have a zero coefficient
n_ignored = sum(____)
print(f"The model has ignored {n_ignored} out of {len(la.coef_)} features.")