Hoe voer je de permutatietoets uit
Op basis van onze EDA en parameterinschattingen is het lastig om verbetering van halve finale naar finale te zien. In de volgende oefening ga je de hypothese testen dat er geen verschil is in prestaties tussen halve finales en finales. Een permutatietoets past hier goed bij. We gebruiken de gemiddelde waarde van f als toetsingsgrootheid. Welke van de volgende opties simuleert het verkrijgen van de toetsingsgrootheid onder de nulhypothese?
- Strategie 1
- Neem voor elke zwemmer en elke slag/afstand een array met tijden van de halve finale en een array met tijden van de finale.
- Doorloop elke array en wissel voor elke index met 50% kans de waarden in de respectieve finale- en halvefinale-array om.
- Gebruik de resulterende finale- en halvefinale-arrays om
fte berekenen en vervolgens het gemiddelde vanf. - Strategie 2
- Neem voor elke zwemmer en elke slag/afstand een array met tijden van de halve finale en een array met tijden van de finale en concateneer die, zodat je in totaal 96 waarden hebt.
- Hussel de geconcateneerde array met de functie
np.permutation(). Wijs de eerste 48 waarden in de gehusselde array toe aan "semifinal" en de laatste 48 aan "final". - Bereken
fop basis van deze nieuwe halvefinale- en finale-arrays en bereken daarna het gemiddelde vanf. - Strategie 3
- Neem de array
fdie we in de vorige oefening gebruikten. - Vermenigvuldig elk element van
fmet1of-1met gelijke kans. - Bereken het gemiddelde van deze nieuwe array om de toetsingsgrootheid te krijgen.
- Strategie 4
- Definieer een functie met signatuur
compute_f(semi_times, final_times)omfte berekenen op basis van ingevoerde zwemtijd-arrays. - Trek een permutatiereplicaat met
dcst.draw_perm_reps(semi_times, final_times, compute_f).
Deze oefening maakt deel uit van de cursus
Casestudies in statistisch denken
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen