Intercetta e punti di partenza
In questo esercizio vedrai i parametri di intercetta e pendenza nel contesto della modellazione di misurazioni del volume di una soluzione contenuta in una grande brocca di vetro. La soluzione è composta da acqua, cereali, zuccheri e lievito. È stata registrata anche la massa totale della soluzione e del contenitore di vetro, ma non è stata annotata la massa del contenitore vuoto.
Il tuo compito è usare il DataFrame pandas df già caricato, con le colonne volumes e masses, per costruire un modello lineare che metta in relazione le masses (dati y) con i volumes (dati x). La pendenza sarà una stima della densità (variazione di massa / variazione di volume) della soluzione, e l'intercetta sarà una stima del peso del contenitore vuoto (massa quando volume=0).

Questo esercizio fa parte del corso
Introduzione alla modellazione lineare in Python
Istruzioni dell'esercizio
- Importa
ols()dastatsmodelse usala per costruire un modello adattato adata=dfconformula = "masses ~ volumes". - Estrai l'intercetta
a0e la pendenzaa1con.params['Intercept']e.params['volumes'], rispettivamente. - Stampa
a0ea1con nomi significativi dal punto di vista fisico. - Stampa
model_fit()e cerca valori che corrispondano a quelli trovati sopra; cerca le etichette di rigaIntercept,volumes, e un'etichetta di colonnacoef.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import ols from statsmodels, and fit a model to the data
from statsmodels.formula.api import ols
model_fit = ols(formula="____ ~ ____", data=____)
model_fit = model_fit.fit()
# Extract the model parameter values, and assign them to a0, a1
a0 = model_fit.params['____']
a1 = model_fit.params['____']
# Print model parameter values with meaningful names, and compare to summary()
print( "container_mass = {:0.4f}".format(____) )
print( "solution_density = {:0.4f}".format(____) )
print( model_fit.summary() )