CommencerCommencer gratuitement

Créer un régressseur LASSO

Vous allez travailler sur le jeu de données numérique ANSUR des mesures corporelles pour prédire l’Indice de Masse Corporelle (IMC) d’une personne à l’aide du régleur Lasso() déjà importé. L’IMC est un indicateur dérivé de la taille et du poids, mais ces deux variables ont été retirées du jeu de données pour rendre la tâche plus intéressante au modèle.

Vous commencerez par standardiser les données avec StandardScaler(), déjà instancié sous le nom scaler, afin que tous les coefficients subissent une force de régularisation comparable visant à les réduire.

Toutes les fonctions et classes nécessaires, ainsi que les jeux de données d’entrée X et y, ont été préchargés.

Cet exercice fait partie du cours

Réduction de dimension en Python

Afficher le cours

Instructions

  • Réglez la taille du test à 30 % pour obtenir une répartition apprentissage/test de 70 % – 30 %.
  • Ajustez le scaler sur les variables d’entraînement et transformez-les en une seule étape.
  • Créez le modèle Lasso.
  • Ajustez-le sur les données d’entraînement mises à l’échelle.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Set the test size to 30% to get a 70-30% train test split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=____, random_state=0)

# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____

# Create the Lasso model
la = ____()

# Fit it to the standardized training data
la.____
Modifier et exécuter le code