Resultaten van het Lasso-model
Nu je het Lasso-model hebt getraind, ga je de voorspellende capaciteit (\(R^2\)) op de testset bepalen en tellen hoeveel features worden genegeerd omdat hun coëfficiënt naar nul is teruggebracht.
De X_test- en y_test-gegevenssets zijn alvast voor je ingeladen.
Het Lasso()-model en de StandardScaler() zijn respectievelijk geïnstantieerd als la en scaler en beide zijn gefit op de trainingsdata.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in Python
Oefeninstructies
- Transformeer de testset met de vooraf gefitte scaler.
- Bereken de \(R^2\)-waarde op de geschaalde testdata.
- Maak een lijst met True-waarden wanneer coëfficiënten gelijk zijn aan 0.
- Bereken het totale aantal features met een coëfficiënt van 0.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Transform the test set with the pre-fitted scaler
X_test_std = scaler.____
# Calculate the coefficient of determination (R squared) on X_test_std
r_squared = la.____(____, ____)
print(f"The model can predict {r_squared:.1%} of the variance in the test set.")
# Create a list that has True values when coefficients equal 0
zero_coef = la.____ == ____
# Calculate how many features have a zero coefficient
n_ignored = sum(____)
print(f"The model has ignored {n_ignored} out of {len(la.coef_)} features.")