Eén permutatie genereren

In de komende oefeningen voeren we een significantietoets uit met permutatietesten. Zoals in de video besproken, willen we weten of er een verschil is tussen de donaties die door de twee ontwerpen zijn gegenereerd — A en B. Stel dat je beide versies een paar dagen hebt laten draaien en 500 donaties op A en 700 donaties op B hebt verzameld, opgeslagen in de variabelen donations_A en donations_B.

We moeten eerst een nulverdeling voor het verschil in gemiddelden genereren. Dat doen we door meerdere permutaties van de gegevensset te maken en voor elk geval het verschil in gemiddelden te berekenen.

Laten we eerst één permutatie genereren en het verschil in gemiddelden voor de gepermuteerde gegevensset berekenen.

Deze oefening maakt deel uit van de cursus

Statisticale simulatie in Python

Bekijk cursus

Oefeninstructies

Concateneer de twee arrays donations_A en donations_B met np.concatenate() en ken dit toe aan data.
Maak één permutatie met np.random.permutation() en ken die toe aan perm.
Bereken het verschil in gemiddelde waarden van permuted_A en permuted_B als diff_in_means.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Concatenate the two arrays donations_A and donations_B into data
len_A, len_B = len(donations_A), len(donations_B)
data = ____([donations_A, donations_B])

# Get a single permutation of the concatenated length
perm = ____(len(donations_A) + len(donations_B))

# Calculate the permutated datasets and difference in means
permuted_A = data[perm[:len(donations_A)]]
permuted_B = data[perm[len(donations_A):]]
diff_in_means = ____
print("Difference in the permuted mean values = {}.".format(diff_in_means))

Code bewerken en uitvoeren