Aan de slagGa gratis aan de slag

Bootstrap-hypothesetoets

De permutatietoets heeft een vrij restrictieve hypothese: dat de boutlengtes van heterozygoten en wildtype identiek verdeeld zijn. Gebruik nu een bootstrap-hypothesetoets om de hypothese te testen dat de gemiddelden gelijk zijn, zonder aannames te doen over de verdelingen.

Deze oefening maakt deel uit van de cursus

Casestudies in statistisch denken

Cursus bekijken

Oefeninstructies

  • Maak een array bout_lengths_concat die alle boutlengtes bevat voor zowel wildtype (bout_lengths_wt) als heterozygoot (bout_lengths_het) met np.concatenate().
  • Bereken het gemiddelde van alle boutlengtes uit deze samengevoegde array (bout_lengths_concat) en sla het resultaat op in de variabele mean_bout_length.
  • Verschuif beide gegevenssets zodat ze hetzelfde gemiddelde hebben, namelijk mean_bout_length. Sla de verschoven arrays op in de variabelen wt_shifted en het_shifted.
  • Gebruik dcst.draw_bs_reps() om 10.000 bootstrap-replicaten van het gemiddelde te trekken voor elk van de verschoven gegevenssets. Sla de respectieve replicaten op in bs_reps_wt en bs_reps_het.
  • Trek bs_reps_wt af van bs_reps_het om de bootstrap-replicaten van het verschil van gemiddelden te krijgen. Sla de resultaten op in de variabele bs_reps.
  • Bereken de p-waarde, waarbij "minstens zo extreem als" betekent dat het verschil van gemiddelden onder de nulhypothese groter dan of gelijk is aan het experimenteel waargenomen verschil. De variabele diff_means_exp uit de vorige oefening staat al in je namespace.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Concatenate arrays: bout_lengths_concat
bout_lengths_concat = ____((____, ____))

# Compute mean of all bout_lengths: mean_bout_length
mean_bout_length = ____

# Generate shifted arrays
wt_shifted = ____ - np.mean(____) + ____
het_shifted = ____ - ____ + ____

# Compute 10,000 bootstrap replicates from shifted arrays
bs_reps_wt = ____
bs_reps_het = ____

# Get replicates of difference of means: bs_replicates
bs_reps = ____ - ____

# Compute and print p-value: p
p = ____(____ >= ____) / len(____)
print('p-value =', p)
Code bewerken en uitvoeren