Visualização do desempenho do modelo de regressão

Agora que você já viu como avaliar vários modelos prontos para uso, vai criar três modelos de regressão para prever os níveis de energia ("energy") de uma música.

Ao conjunto de dados music_df, foram acrescentadas variáveis binárias (dummies) referentes a "genre". Além disso, foram criadas matrizes das variáveis independentes e da variável dependente, que foram divididas em X_train, X_test, y_train e y_test.

Já foram importados para você: LinearRegression, Ridge, Lasso, cross_val_score e KFold.

Este exercício faz parte do curso

Aprendizado Supervisionado com o scikit-learn

Ver Curso

Instruções de exercício

  • Escreva um loop for usando model como iterador e model.values() como iterável.
  • Faça a validação cruzada com a matriz das variáveis independentes de treinamento e da variável dependente de treinamento usando o modelo, definindo cv igual a KFold.
  • Acrescente as pontuações da validação cruzada do modelo à lista de resultados.
  • Crie um gráfico de caixa exibindo os resultados, usando como rótulos do eixo x os nomes dos modelos.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

models = {"Linear Regression": LinearRegression(), "Ridge": Ridge(alpha=0.1), "Lasso": Lasso(alpha=0.1)}
results = []

# Loop through the models' values
for ____ in models.values():
  kf = KFold(n_splits=6, random_state=42, shuffle=True)
  
  # Perform cross-validation
  cv_scores = ____(____, ____, ____, cv=____)
  
  # Append the results
  ____.____(____)

# Create a box plot of the results
plt.____(____, labels=____.____())
plt.show()