Estadísticos de prueba y tamaño del efecto

¿Cómo podemos explorar relaciones lineales con bootstrap? ¡Volvamos al sendero! En cada excursión representada como un punto, vemos una relación lineal entre la distancia total recorrida y el tiempo transcurrido. Si tratamos la distancia recorrida como un "efecto" del tiempo transcurrido, entonces podemos explorar la conexión entre la regresión lineal y la inferencia estadística.

En este ejercicio, vas a separar los datos en dos poblaciones, o "categorías": tiempos tempranos y tiempos tardíos. Después observarás las diferencias entre la distancia total recorrida dentro de cada población. Esta diferencia actuará como un "estadístico de prueba", y su distribución pondrá a prueba el efecto de separar distancias por tiempos.

Este ejercicio forma parte del curso

Introducción al modelado lineal en Python

Ver curso

Instrucciones del ejercicio

Usa el "indexado lógico" de numpy, por ejemplo sample_distances[sample_times < 5], para separar las distances de la muestra en poblaciones de tiempos tempranos y tardíos.
Usa np.random.choice() con replacement=True para crear un resample para cada uno de los dos intervalos de tiempo.
Calcula el array test_statistic como resample_long - resample_short, y encuentra e imprime el tamaño del efecto y su incertidumbre con np.mean(), np.std().
Representa la distribución de test_statistic usando el objeto predefinido fig = plot_test_statistic().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create two poulations, sample_distances for early and late sample_times.
# Then resample with replacement, taking 500 random draws from each population.
group_duration_short = sample_distances[____ < 5]
group_duration_long = sample_distances[____ > 5]
resample_short = np.random.choice(____, size=500, replace=____)
resample_long = np.random.choice(____, size=500, replace=____)

# Difference the resamples to compute a test statistic distribution, then compute its mean and stdev
test_statistic = resample_long - resample_short
effect_size = np.mean(____)
standard_error = np.std(____)

# Print and plot the results
print('Test Statistic: mean={:0.2f}, stdev={:0.2f}'.format(____, ____))
fig = plot_test_statistic(____)

Editar y ejecutar código