ComenzarEmpieza gratis

Estudiar los residuos

Para implementar un modelo lineal tienes que estudiar los residuos, que son las distancias entre las predicciones y los datos.

Deben cumplirse tres condiciones:

  1. La media debe ser 0.
  2. La varianza debe ser constante.
  3. La distribución debe ser normal.

Trabajaremos con datos de notas de examen de dos colegios, A y B, en la misma asignatura. model_A y model_B se ajustaron con hours_of_study_A y test_scores_A y con hours_of_study_B y test_scores_B, respectivamente.

Se han importado matplotlib.pyplot como plt, numpy como np y LinearRegression de sklearn.linear_model.

Este ejercicio forma parte del curso

Fundamentos de probabilidad en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Scatterplot of hours of study and test scores
plt.scatter(____, ____)

# Plot of hours_of_study_values_A and predicted values
plt.plot(____, model_A.____(hours_of_study_values_A))
plt.title("Model A", fontsize=25)
plt.show()
Editar y ejecutar código