ComenzarEmpieza gratis

Estimadores no estándar

En el último ejercicio, ejecutaste un bootstrap sencillo que ahora vamos a modificar para estimadores más complejos.

Supón que estás estudiando la salud del alumnado. Tienes la estatura y el peso de 1000 estudiantes y te interesan la mediana de la estatura, así como la correlación entre estatura y peso, y el IC del 95% asociado a estas magnitudes. Vamos a usar bootstrapping.

Examina el DataFrame de pandas df con las estaturas y pesos de 1000 estudiantes. Usándolo, calcula el IC del 95% tanto para la estatura mediana como para la correlación entre estatura y peso.

Este ejercicio forma parte del curso

Simulación estadística en Python

Ver curso

Instrucciones del ejercicio

  • Usa el método .sample() sobre df para generar una muestra de los datos con reemplazo y asígnala a tmp_df.
  • Para cada conjunto de datos generado en tmp_df, calcula la mediana de las estaturas y la correlación entre estaturas y pesos usando .median() y .corr().
  • Añade las medianas de estatura a height_medians y la correlación a hw_corr.
  • Por último, calcula los intervalos de confianza del 95% ([2.5, 97.5]) para cada una de las cantidades anteriores usando np.percentile().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Sample with replacement and calculate quantities of interest
sims, data_size, height_medians, hw_corr = 1000, df.shape[0], [], []
for i in range(sims):
    tmp_df = ____(n=____, replace=____)
    height_medians.append(____)
    hw_corr.append(____)

# Calculate confidence intervals
height_median_ci = np.____
height_weight_corr_ci = np.____
print("Height Median CI = {} \nHeight Weight Correlation CI = {}".format( height_median_ci, height_weight_corr_ci))
Editar y ejecutar código