Visualização do desempenho do modelo de regressão
Agora que você já viu como avaliar vários modelos prontos para uso, vai criar três modelos de regressão para prever os níveis de energia ("energy") de uma música.
Ao conjunto de dados music_df, foram acrescentadas variáveis binárias (dummies) referentes a "genre". Além disso, foram criadas matrizes das variáveis independentes e da variável dependente, que foram divididas em X_train, X_test, y_train e y_test.
Já foram importados para você: LinearRegression, Ridge, Lasso, cross_val_score e KFold.
Este exercicio faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções do exercicio
- Escreva um loop for usando
modelcomo iterador emodel.values()como iterável. - Faça a validação cruzada com a matriz das variáveis independentes de treinamento e da variável dependente de treinamento usando o modelo, definindo
cvigual aKFold. - Acrescente as pontuações da validação cruzada do modelo à lista de resultados.
- Crie um gráfico de caixa exibindo os resultados, usando como rótulos do eixo x os nomes dos modelos.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
models = {"Linear Regression": LinearRegression(), "Ridge": Ridge(alpha=0.1), "Lasso": Lasso(alpha=0.1)}
results = []
# Loop through the models' values
for ____ in models.values():
kf = KFold(n_splits=6, random_state=42, shuffle=True)
# Perform cross-validation
cv_scores = ____(____, ____, ____, cv=____)
# Append the results
____.____(____)
# Create a box plot of the results
plt.____(____, labels=____.____())
plt.show()