Visualisation de la performance des modèles de régression
Maintenant que vous avez vu comment évaluer plusieurs modèles, vous allez construire trois modèles de régression pour prédire les niveaux "energy"
d’une chanson.
Des variables muettes pour "genre"
ont été ajoutées à l’ensemble de données music_df
. Des tableaux de caractéristiques et de cibles ont également été créés et divisés en X_train
, X_test
, y_train
et y_test
.
LinearRegression
, Ridge
, Lasso
, cross_val_score
et KFold
ont été importés pour vous.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions d’exercice
- Écrivez une boucle for en utilisant
model
comme itérateur etmodel.values()
comme itérable. - Effectuez une validation croisée sur les caractéristiques d’apprentissage et le tableau cible d’apprentissage à l’aide du modèle, en définissant
cv
sur l’objetKFold
. - Ajoutez les scores de validation croisée du modèle à la liste des résultats.
- Créez un diagramme en boîte affichant les résultats, les étiquettes de l’axe des x étant les noms des modèles.
Exercice interactif pratique
Essayez-vous à cet exercice en complétant cet exemple de code.
models = {"Linear Regression": LinearRegression(), "Ridge": Ridge(alpha=0.1), "Lasso": Lasso(alpha=0.1)}
results = []
# Loop through the models' values
for ____ in models.values():
kf = KFold(n_splits=6, random_state=42, shuffle=True)
# Perform cross-validation
cv_scores = ____(____, ____, ____, cv=____)
# Append the results
____.____(____)
# Create a box plot of the results
plt.____(____, labels=____.____())
plt.show()