Ipotesi nulla
In questo esercizio, formuliamo l'ipotesi nulla come
le durate brevi e lunghe non hanno alcun effetto sulla distanza totale percorsa.
Interpretiamo la "dimensione dell'effetto zero" nel senso che, se rimescolassimo i campioni tra tempi brevi e lunghi, in modo che due nuovi campioni abbiano ciascuno un mix di viaggi di breve e lunga durata, e poi calcolassimo la statistica del test, in media sarebbe zero.
In questo esercizio, il tuo obiettivo è eseguire lo shuffling e il riacampionamento. Parti da group_duration_short e group_duration_long, che sono i gruppi di durata non rimescolati.
Questo esercizio fa parte del corso
Introduzione alla modellazione lineare in Python
Istruzioni dell'esercizio
- Usa
np.concatenate()per unire le due popolazioni, poi usanp.random.shuffle()per rimescolare i valori all'interno di quel contenitore. - Dividi
shuffle_bucketa metà e usanp.random.choice()per riacampionare ciascunashuffle_half. - Calcola la
test_statisticsottraendoresample_half1daresample_half2. - Calcola la
effect_sizecomenp.mean()ditest_statistice stampa il risultato.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Shuffle the time-ordered distances, then slice the result into two populations.
shuffle_bucket = np.____((group_duration_short, group_duration_long))
np.random.shuffle(____)
slice_index = len(shuffle_bucket)//2
shuffled_half1 = shuffle_bucket[0:____]
shuffled_half2 = shuffle_bucket[____:]
# Create new samples from each shuffled population, and compute the test statistic
resample_half1 = np.random.choice(____, size=500, replace=____)
resample_half2 = np.random.choice(____, size=500, replace=____)
test_statistic = ____ - ____
# Compute and print the effect size
effect_size = np.mean(____)
print('Test Statistic, after shuffling, mean = {}'.format(____))