Regresión lineal en los datos adecuados de Anscombe
Para practicar, realiza una regresión lineal en el conjunto de datos del cuarteto de Anscombe que tenga una interpretación más razonable mediante regresión lineal.
Este ejercicio forma parte del curso
Pensamiento estadístico en Python (Parte 2)
Instrucciones del ejercicio
- Calcula los parámetros de la pendiente y la intersección usando
np.polyfit(). Los datos de Anscombe están en los arraysxyy. - Imprime la pendiente
ay la intersecciónb. - Genera datos teóricos de \(x\) y \(y\) a partir de la regresión lineal. Tu array de \(x\), que puedes crear con
np.array(), debe contener3y15. Para generar los datos de \(y\), multiplica la pendiente porx_theory suma la intersección. - Representa los datos de Anscombe como un diagrama de dispersión y después dibuja la recta teórica. Recuerda incluir los argumentos
marker='.'ylinestyle='none'además dexyycuando representes los datos de Anscombe como diagrama de dispersión. No necesitas estos argumentos al dibujar la recta teórica. - Pulsa Enviar para ver la gráfica.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Perform linear regression: a, b
a, b = ____
# Print the slope and intercept
print(____, ____)
# Generate theoretical x and y data: x_theor, y_theor
x_theor = np.array([____, ____])
y_theor = ____ * ____ + ____
# Plot the Anscombe data and theoretical line
_ = ____
_ = ____
# Label the axes
plt.xlabel('x')
plt.ylabel('y')
# Show the plot
plt.show()