Estudando os resíduos
Para implementar um modelo linear, você precisa estudar os resíduos, que são as distâncias entre as previsões do modelo e os dados observados.
Três condições devem ser atendidas:
- A média deve ser 0.
- A variância deve ser constante.
- A distribuição deve ser normal.
Vamos trabalhar com dados de notas de prova de duas escolas, A e B, na mesma disciplina. model_A e model_B foram ajustados com hours_of_study_A e test_scores_A e com hours_of_study_B e test_scores_B, respectivamente.
matplotlib.pyplot já foi importado como plt, numpy como np e LinearRegression de sklearn.linear_model.
Este exercício faz parte do curso
Fundamentos de Probabilidade em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Scatterplot of hours of study and test scores
plt.scatter(____, ____)
# Plot of hours_of_study_values_A and predicted values
plt.plot(____, model_A.____(hours_of_study_values_A))
plt.title("Model A", fontsize=25)
plt.show()