ComenzarEmpieza gratis

Estadísticos de prueba y tamaño del efecto

¿Cómo podemos explorar relaciones lineales con bootstrap? ¡Volvamos al sendero! En cada excursión representada como un punto, vemos una relación lineal entre la distancia total recorrida y el tiempo transcurrido. Si tratamos la distancia recorrida como un "efecto" del tiempo transcurrido, entonces podemos explorar la conexión entre la regresión lineal y la inferencia estadística.

En este ejercicio, vas a separar los datos en dos poblaciones, o "categorías": tiempos tempranos y tiempos tardíos. Después observarás las diferencias entre la distancia total recorrida dentro de cada población. Esta diferencia actuará como un "estadístico de prueba", y su distribución pondrá a prueba el efecto de separar distancias por tiempos.

ch04_ex11_fig03.png

Este ejercicio forma parte del curso

Introducción al modelado lineal en Python

Ver curso

Instrucciones del ejercicio

  • Usa el "indexado lógico" de numpy, por ejemplo sample_distances[sample_times < 5], para separar las distances de la muestra en poblaciones de tiempos tempranos y tardíos.
  • Usa np.random.choice() con replacement=True para crear un resample para cada uno de los dos intervalos de tiempo.
  • Calcula el array test_statistic como resample_long - resample_short, y encuentra e imprime el tamaño del efecto y su incertidumbre con np.mean(), np.std().
  • Representa la distribución de test_statistic usando el objeto predefinido fig = plot_test_statistic().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create two poulations, sample_distances for early and late sample_times.
# Then resample with replacement, taking 500 random draws from each population.
group_duration_short = sample_distances[____ < 5]
group_duration_long = sample_distances[____ > 5]
resample_short = np.random.choice(____, size=500, replace=____)
resample_long = np.random.choice(____, size=500, replace=____)

# Difference the resamples to compute a test statistic distribution, then compute its mean and stdev
test_statistic = resample_long - resample_short
effect_size = np.mean(____)
standard_error = np.std(____)

# Print and plot the results
print('Test Statistic: mean={:0.2f}, stdev={:0.2f}'.format(____, ____))
fig = plot_test_statistic(____)
Editar y ejecutar código