Bootstrap-hypothesetoets
De permutatietoets heeft een vrij restrictieve hypothese: dat de boutlengtes van heterozygoten en wildtype identiek verdeeld zijn. Gebruik nu een bootstrap-hypothesetoets om de hypothese te testen dat de gemiddelden gelijk zijn, zonder aannames te doen over de verdelingen.
Deze oefening maakt deel uit van de cursus
Casestudies in statistisch denken
Oefeninstructies
- Maak een array
bout_lengths_concatdie alle boutlengtes bevat voor zowel wildtype (bout_lengths_wt) als heterozygoot (bout_lengths_het) metnp.concatenate(). - Bereken het gemiddelde van alle boutlengtes uit deze samengevoegde array (
bout_lengths_concat) en sla het resultaat op in de variabelemean_bout_length. - Verschuif beide gegevenssets zodat ze hetzelfde gemiddelde hebben, namelijk
mean_bout_length. Sla de verschoven arrays op in de variabelenwt_shiftedenhet_shifted. - Gebruik
dcst.draw_bs_reps()om 10.000 bootstrap-replicaten van het gemiddelde te trekken voor elk van de verschoven gegevenssets. Sla de respectieve replicaten op inbs_reps_wtenbs_reps_het. - Trek
bs_reps_wtaf vanbs_reps_hetom de bootstrap-replicaten van het verschil van gemiddelden te krijgen. Sla de resultaten op in de variabelebs_reps. - Bereken de p-waarde, waarbij "minstens zo extreem als" betekent dat het verschil van gemiddelden onder de nulhypothese groter dan of gelijk is aan het experimenteel waargenomen verschil. De variabele
diff_means_expuit de vorige oefening staat al in je namespace.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Concatenate arrays: bout_lengths_concat
bout_lengths_concat = ____((____, ____))
# Compute mean of all bout_lengths: mean_bout_length
mean_bout_length = ____
# Generate shifted arrays
wt_shifted = ____ - np.mean(____) + ____
het_shifted = ____ - ____ + ____
# Compute 10,000 bootstrap replicates from shifted arrays
bs_reps_wt = ____
bs_reps_het = ____
# Get replicates of difference of means: bs_replicates
bs_reps = ____ - ____
# Compute and print p-value: p
p = ____(____ >= ____) / len(____)
print('p-value =', p)