Hoe hangt het stroomeffect samen met de baanpositie?
Om het effect van baannummer op de prestatie te kwantificeren, voer je een lineaire regressie uit van f_13 tegen lanes. Doe een pairs-bootstrapberekening om een 95%-betrouwbaarheidsinterval te krijgen. Maak ten slotte een plot van de regressie. De arrays lanes en f_13 staan al in je namespace.
Merk op dat we foutbalken op de gemiddelde fractionele verschillen zouden kunnen berekenen en die in de regressie kunnen gebruiken, maar dat valt buiten de scope van deze cursus.
Deze oefening maakt deel uit van de cursus
Casestudies in statistisch denken
Oefeninstructies
- Bereken de helling en het snijpunt van de lijn
f_13tegenlanesmetnp.polyfit(). - Gebruik
dcst.draw_bs_pairs_linreg()om 10.000 bootstrap-replicaties van de helling en het snijpunt te verkrijgen, en sla die respectievelijk op inbs_reps_slopeenbs_reps_int. - Gebruik de bootstrap-replicaties om een 95%-betrouwbaarheidsinterval voor de helling te berekenen.
- Print de helling en het 95%-betrouwbaarheidsinterval naar het scherm. Dit is al voor je gedaan.
- Genereer met
np.array()x-waarden voor de plot van de bootstrap-lijnen.xmoet lopen van1tot en met8. - De plot bevat de gegevens al. Schrijf een
for-lus om 100 bootstrap-lijnen aan de plot toe te voegen met de keyword-argumentencolor='red',alpha=0.2enlinewidth=0.5.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute the slope and intercept of the frac diff/lane curve
____, ____ = ____
# Compute bootstrap replicates
bs_reps_slope, bs_reps_int = ____
# Compute 95% confidence interval of slope
conf_int = ____
# Print slope and confidence interval
print("""
slope: {0:.5f} per lane
95% conf int: [{1:.5f}, {2:.5f}] per lane""".format(slope, *conf_int))
# x-values for plotting regression lines
x = ____
# Plot 100 bootstrap replicate lines
for i in ____:
_ = ____(____, ____[i] * ____ + ____[i],
color='red', alpha=0.2, linewidth=0.5)
# Update the plot
plt.draw()
plt.show()