Estadísticos de prueba y tamaño del efecto
¿Cómo podemos explorar relaciones lineales con bootstrap? ¡Volvamos al sendero! En cada excursión representada como un punto, vemos una relación lineal entre la distancia total recorrida y el tiempo transcurrido. Si tratamos la distancia recorrida como un "efecto" del tiempo transcurrido, entonces podemos explorar la conexión entre la regresión lineal y la inferencia estadística.
En este ejercicio, vas a separar los datos en dos poblaciones, o "categorías": tiempos tempranos y tiempos tardíos. Después observarás las diferencias entre la distancia total recorrida dentro de cada población. Esta diferencia actuará como un "estadístico de prueba", y su distribución pondrá a prueba el efecto de separar distancias por tiempos.

Este ejercicio forma parte del curso
Introducción al modelado lineal en Python
Instrucciones del ejercicio
- Usa el "indexado lógico" de
numpy, por ejemplosample_distances[sample_times < 5], para separar lasdistancesde la muestra en poblaciones de tiempos tempranos y tardíos. - Usa
np.random.choice()conreplacement=Truepara crear unresamplepara cada uno de los dos intervalos de tiempo. - Calcula el array
test_statisticcomoresample_long - resample_short, y encuentra e imprime el tamaño del efecto y su incertidumbre connp.mean(),np.std(). - Representa la distribución de
test_statisticusando el objeto predefinidofig = plot_test_statistic().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create two poulations, sample_distances for early and late sample_times.
# Then resample with replacement, taking 500 random draws from each population.
group_duration_short = sample_distances[____ < 5]
group_duration_long = sample_distances[____ > 5]
resample_short = np.random.choice(____, size=500, replace=____)
resample_long = np.random.choice(____, size=500, replace=____)
# Difference the resamples to compute a test statistic distribution, then compute its mean and stdev
test_statistic = resample_long - resample_short
effect_size = np.mean(____)
standard_error = np.std(____)
# Print and plot the results
print('Test Statistic: mean={:0.2f}, stdev={:0.2f}'.format(____, ____))
fig = plot_test_statistic(____)