CommencerCommencez gratuitement

Visualisation de la performance des modèles de régression

Maintenant que vous avez vu comment évaluer plusieurs modèles, vous allez construire trois modèles de régression pour prédire les niveaux "energy" d’une chanson.

Des variables muettes pour "genre" ont été ajoutées à l’ensemble de données music_df. Des tableaux de caractéristiques et de cibles ont également été créés et divisés en X_train, X_test, y_train et y_test.

LinearRegression, Ridge, Lasso, cross_val_score et KFold ont été importés pour vous.

Cet exercice fait partie du cours

Apprentissage supervisé avec scikit-learn

Afficher le cours

Instructions d’exercice

  • Écrivez une boucle for en utilisant model comme itérateur et model.values() comme itérable.
  • Effectuez une validation croisée sur les caractéristiques d’apprentissage et le tableau cible d’apprentissage à l’aide du modèle, en définissant cv sur l’objet KFold.
  • Ajoutez les scores de validation croisée du modèle à la liste des résultats.
  • Créez un diagramme en boîte affichant les résultats, les étiquettes de l’axe des x étant les noms des modèles.

Exercice interactif pratique

Essayez-vous à cet exercice en complétant cet exemple de code.

models = {"Linear Regression": LinearRegression(), "Ridge": Ridge(alpha=0.1), "Lasso": Lasso(alpha=0.1)}
results = []

# Loop through the models' values
for ____ in models.values():
  kf = KFold(n_splits=6, random_state=42, shuffle=True)
  
  # Perform cross-validation
  cv_scores = ____(____, ____, ____, cv=____)
  
  # Append the results
  ____.____(____)

# Create a box plot of the results
plt.____(____, labels=____.____())
plt.show()
Modifier et exécuter du code