Visualização do desempenho do modelo de regressão
Agora que você já viu como avaliar vários modelos prontos para uso, vai criar três modelos de regressão para prever os níveis de energia ("energy"
) de uma música.
Ao conjunto de dados music_df
, foram acrescentadas variáveis binárias (dummies) referentes a "genre"
. Além disso, foram criadas matrizes das variáveis independentes e da variável dependente, que foram divididas em X_train
, X_test
, y_train
e y_test
.
Já foram importados para você: LinearRegression
, Ridge
, Lasso
, cross_val_score
e KFold
.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções de exercício
- Escreva um loop for usando
model
como iterador emodel.values()
como iterável. - Faça a validação cruzada com a matriz das variáveis independentes de treinamento e da variável dependente de treinamento usando o modelo, definindo
cv
igual aKFold
. - Acrescente as pontuações da validação cruzada do modelo à lista de resultados.
- Crie um gráfico de caixa exibindo os resultados, usando como rótulos do eixo x os nomes dos modelos.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
models = {"Linear Regression": LinearRegression(), "Ridge": Ridge(alpha=0.1), "Lasso": Lasso(alpha=0.1)}
results = []
# Loop through the models' values
for ____ in models.values():
kf = KFold(n_splits=6, random_state=42, shuffle=True)
# Perform cross-validation
cv_scores = ____(____, ____, ____, cv=____)
# Append the results
____.____(____)
# Create a box plot of the results
plt.____(____, labels=____.____())
plt.show()