Estudiar los residuos
Para implementar un modelo lineal tienes que estudiar los residuos, que son las distancias entre las predicciones y los datos.
Deben cumplirse tres condiciones:
- La media debe ser 0.
- La varianza debe ser constante.
- La distribución debe ser normal.
Trabajaremos con datos de notas de examen de dos colegios, A y B, en la misma asignatura. model_A y model_B se ajustaron con hours_of_study_A y test_scores_A y con hours_of_study_B y test_scores_B, respectivamente.
Se han importado matplotlib.pyplot como plt, numpy como np y LinearRegression de sklearn.linear_model.
Este ejercicio forma parte del curso
Fundamentos de probabilidad en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Scatterplot of hours of study and test scores
plt.scatter(____, ____)
# Plot of hours_of_study_values_A and predicted values
plt.plot(____, model_A.____(hours_of_study_values_A))
plt.title("Model A", fontsize=25)
plt.show()