Eén permutatie genereren
In de komende oefeningen voeren we een significantietoets uit met permutatietesten. Zoals in de video besproken, willen we weten of er een verschil is tussen de donaties die door de twee ontwerpen zijn gegenereerd — A en B. Stel dat je beide versies een paar dagen hebt laten draaien en 500 donaties op A en 700 donaties op B hebt verzameld, opgeslagen in de variabelen donations_A en donations_B.
We moeten eerst een nulverdeling voor het verschil in gemiddelden genereren. Dat doen we door meerdere permutaties van de gegevensset te maken en voor elk geval het verschil in gemiddelden te berekenen.
Laten we eerst één permutatie genereren en het verschil in gemiddelden voor de gepermuteerde gegevensset berekenen.
Deze oefening maakt deel uit van de cursus
Statisticale simulatie in Python
Oefeninstructies
- Concateneer de twee arrays
donations_Aendonations_Bmetnp.concatenate()en ken dit toe aandata. - Maak één permutatie met
np.random.permutation()en ken die toe aanperm. - Bereken het verschil in gemiddelde waarden van
permuted_Aenpermuted_Balsdiff_in_means.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Concatenate the two arrays donations_A and donations_B into data
len_A, len_B = len(donations_A), len(donations_B)
data = ____([donations_A, donations_B])
# Get a single permutation of the concatenated length
perm = ____(len(donations_A) + len(donations_B))
# Calculate the permutated datasets and difference in means
permuted_A = data[perm[:len(donations_A)]]
permuted_B = data[perm[len(donations_A):]]
diff_in_means = ____
print("Difference in the permuted mean values = {}.".format(diff_in_means))