Regressione lineare sui dati appropriati di Anscombe
Per esercitarti, esegui una regressione lineare sul set di dati del quartetto di Anscombe che si presta meglio a un'interpretazione lineare.
Questo esercizio fa parte del corso
Pensiero statistico in Python (Parte 2)
Istruzioni dell'esercizio
- Calcola i parametri della pendenza e dell'intercetta usando
np.polyfit(). I dati di Anscombe sono memorizzati negli arrayxey. - Stampa la pendenza
ae l'intercettab. - Genera dati teorici di \(x\) e \(y\) dalla regressione lineare. Il tuo array \(x\), che puoi creare con
np.array(), deve essere composto da3e15. Per generare i dati di \(y\), moltiplica la pendenza perx_theore aggiungi l'intercetta. - Rappresenta i dati di Anscombe come scatter plot e poi traccia la retta teorica. Ricorda di includere gli argomenti
marker='.'elinestyle='none'oltre axeyquando tracci lo scatter plot dei dati di Anscombe. Non ti servono questi argomenti quando tracci la retta teorica. - Premi Invia per vedere il grafico!
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Perform linear regression: a, b
a, b = ____
# Print the slope and intercept
print(____, ____)
# Generate theoretical x and y data: x_theor, y_theor
x_theor = np.array([____, ____])
y_theor = ____ * ____ + ____
# Plot the Anscombe data and theoretical line
_ = ____
_ = ____
# Label the axes
plt.xlabel('x')
plt.ylabel('y')
# Show the plot
plt.show()