Hipótesis nula
En este ejercicio, formulamos la hipótesis nula como:
las duraciones de tiempo cortas y largas no tienen efecto sobre la distancia total recorrida.
Interpretamos el "tamaño de efecto cero" como que, si mezclamos (barajamos) las muestras entre tiempos cortos y largos, de modo que dos nuevas muestras tengan una mezcla de trayectos de corta y larga duración, y luego calculamos el estadístico de prueba, en promedio será cero.
En este ejercicio, tu objetivo es realizar la mezcla y la remuestra. Empieza con group_duration_short y group_duration_long, que son los grupos de duración de tiempo sin barajar.
Este ejercicio forma parte del curso
Introducción al modelado lineal en Python
Instrucciones del ejercicio
- Usa
np.concatenate()para combinar las dos poblaciones y luego usanp.random.shuffle()para barajar los valores dentro de ese contenedor. - Corta
shuffle_bucketpor la mitad y usanp.random.choice()para remuestrear cadashuffle_half. - Calcula el
test_statisticrestandoresample_half1deresample_half2. - Calcula el
effect_sizecomo elnp.mean()detest_statistice imprime el resultado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Shuffle the time-ordered distances, then slice the result into two populations.
shuffle_bucket = np.____((group_duration_short, group_duration_long))
np.random.shuffle(____)
slice_index = len(shuffle_bucket)//2
shuffled_half1 = shuffle_bucket[0:____]
shuffled_half2 = shuffle_bucket[____:]
# Create new samples from each shuffled population, and compute the test statistic
resample_half1 = np.random.choice(____, size=500, replace=____)
resample_half2 = np.random.choice(____, size=500, replace=____)
test_statistic = ____ - ____
# Compute and print the effect size
effect_size = np.mean(____)
print('Test Statistic, after shuffling, mean = {}'.format(____))